Το OpenAI ανακοινώνει το GPT-4 – την επόμενη γενιά του γλωσσικού μοντέλου τεχνητής νοημοσύνης του
15 Mar Το OpenAI ανακοινώνει το GPT-4 – την επόμενη γενιά του γλωσσικού μοντέλου τεχνητής νοημοσύνης του
Posted at 15:19h
in INTERNET
by Soustas
Μετά από μήνες φημών και εικασιών, η OpenAI ανακοίνωσε το GPT-4: το τελευταίο στη σειρά γλωσσικών μοντέλων AI που τροφοδοτούν εφαρμογές όπως το ChatGPT και το νέο Bing.
Η εταιρεία ισχυρίζεται ότι το μοντέλο είναι “πιο δημιουργικό και συνεργατικό από ποτέ” και “μπορεί να λύσει δύσκολα προβλήματα με μεγαλύτερη ακρίβεια”. Μπορεί να αναλύσει τόσο κείμενο όσο και εικόνα εισόδου, αν και μπορεί να απαντήσει μόνο μέσω κειμένου. Η OpenAI προειδοποιεί επίσης ότι τα συστήματα διατηρούν πολλά από τα ίδια προβλήματα με τα προηγούμενα γλωσσικά μοντέλα, συμπεριλαμβανομένης της τάσης να επινοούν πληροφορίες (ή να “παραισθήσεις”) και της ικανότητας να δημιουργούν βίαια και επιβλαβή κείμενα.
Η OpenAI αναφέρει ότι έχει ήδη συνεργαστεί με διάφορες εταιρείες για την ενσωμάτωση του GPT-4 στα προϊόντα τους, συμπεριλαμβανομένων των Duolingo, Stripe και Khan Academy. Το νέο μοντέλο είναι διαθέσιμο στο ευρύ κοινό μέσω του ChatGPT Plus, της μηνιαίας συνδρομής ChatGPT της OpenAI αξίας 20 δολαρίων, και τροφοδοτεί το chatbot Bing της Microsoft. Θα είναι επίσης προσβάσιμο ως API για προγραμματιστές που θα μπορούν να βασιστούν σε αυτό. (Υπάρχει λίστα αναμονής εδώ, η οποία, σύμφωνα με την OpenAI, θα αρχίσει να δέχεται χρήστες από σήμερα).
Σε ένα ερευνητικό blog post, η OpenAI ανέφερε ότι η διάκριση μεταξύ του GPT-4 και του προκατόχου του GPT-3.5 είναι “λεπτή” σε περιστασιακή συζήτηση (το GPT-3.5 είναι το μοντέλο που τροφοδοτεί το ChatGPT). Ο διευθύνων σύμβουλος της OpenAI, Sam Altman, έγραψε στο Twitter ότι το GPT-4 “εξακολουθεί να είναι ελαττωματικό, εξακολουθεί να είναι περιορισμένο”, αλλά ότι επίσης “εξακολουθεί να φαίνεται πιο εντυπωσιακό κατά την πρώτη χρήση από ό,τι όταν περάσετε περισσότερο χρόνο μαζί του”.
Announcing GPT-4, a large multimodal model, with our best-ever results on capabilities and alignment: https://t.co/TwLFssyALF pic.twitter.com/lYWwPjZbSg
— OpenAI (@OpenAI) March 14, 2023
Σύμφωνα με την εταιρεία, οι βελτιώσεις του GPT-4 είναι εμφανείς στις επιδόσεις του συστήματος σε μια σειρά δοκιμασιών και κριτηρίων αναφοράς, συμπεριλαμβανομένων των εξετάσεων Uniform Bar Exam, LSAT, SAT Math και SAT Evidence-Based Reading & Writing. Στις εξετάσεις που αναφέρθηκαν, το GPT-4 σημείωσε βαθμολογία στο 88ο εκατοστημόριο και άνω, ενώ μια πλήρη λίστα με τις εξετάσεις και τις βαθμολογίες του συστήματος μπορείτε να δείτε εδώ.
Οι εικασίες σχετικά με το GPT-4 και τις δυνατότητές του ήταν έντονες τον τελευταίο χρόνο, με πολλούς να υποστηρίζουν ότι θα αποτελούσε τεράστιο άλμα σε σχέση με τα προηγούμενα συστήματα. Ωστόσο, αν κρίνουμε από την ανακοίνωση της OpenAI, η βελτίωση είναι περισσότερο επαναληπτική, όπως προειδοποίησε προηγουμένως η εταιρεία.
“Ο κόσμος παρακαλάει να απογοητευτεί και θα απογοητευτεί”, δήλωσε ο Altman σε συνέντευξή του για το GPT-4 τον Ιανουάριο. “Η διαφημιστική εκστρατεία είναι ακριβώς όπως… Δεν έχουμε ένα πραγματικό AGI και αυτό είναι κατά κάποιο τρόπο αυτό που περιμένουν από εμάς”.
Ο μύλος των φημών ενεργοποιήθηκε περαιτέρω την περασμένη εβδομάδα αφού ένα στέλεχος της Microsoft άφησε να διαρρεύσει ότι το σύστημα θα κυκλοφορήσει αυτή την εβδομάδα σε συνέντευξή του στον γερμανικό Τύπο. Το στέλεχος πρότεινε επίσης ότι το σύστημα θα είναι πολυτροπικό – δηλαδή θα μπορεί να παράγει όχι μόνο κείμενο αλλά και άλλα μέσα. Πολλοί ερευνητές της τεχνητής νοημοσύνης πιστεύουν ότι τα πολυτροπικά συστήματα που ενσωματώνουν κείμενο, ήχο και βίντεο προσφέρουν τον καλύτερο δρόμο προς τη δημιουργία πιο ικανών συστημάτων τεχνητής νοημοσύνης.
Το GPT-4 είναι όντως πολυτροπικό, αλλά σε λιγότερα μέσα από όσα κάποιοι προέβλεπαν. Το OpenAI λέει ότι το σύστημα μπορεί να δεχτεί εισόδους κειμένου και εικόνας και να εκπέμψει εξόδους κειμένου. Η εταιρεία λέει ότι η ικανότητα του μοντέλου να αναλύει κείμενο και εικόνα ταυτόχρονα του επιτρέπει να ερμηνεύει πιο σύνθετες εισόδους.
Ήταν ένα μακρύ ταξίδι για να φτάσουμε στο GPT-4, με το OpenAI – και τα γλωσσικά μοντέλα τεχνητής νοημοσύνης γενικότερα – να αναπτύσσουν δυναμική αργά για αρκετά χρόνια, προτού εισέλθουν στην επικρατούσα τάση τους τελευταίους μήνες.
Το αρχικό ερευνητικό έγγραφο που περιγράφει το GPT δημοσιεύθηκε το 2018, με το GPT-2 να ανακοινώνεται το 2019 και το GPT-3 το 2020. Αυτά τα μοντέλα εκπαιδεύονται σε τεράστια σύνολα δεδομένων κειμένου, το μεγαλύτερο μέρος του οποίου προέρχεται από το διαδίκτυο, το οποίο εξορύσσεται για την εξεύρεση στατιστικών μοτίβων. Αυτά τα μοτίβα χρησιμοποιούνται στη συνέχεια για να προβλέψουν ποια λέξη ακολουθεί μια άλλη. Είναι ένας σχετικά απλός μηχανισμός για να περιγραφεί, αλλά το τελικό αποτέλεσμα είναι ευέλικτα συστήματα που μπορούν να παράγουν, να συνοψίζουν και να επαναδιατυπώνουν γραπτά, καθώς και να εκτελούν άλλες εργασίες που βασίζονται στο κείμενο, όπως η μετάφραση ή η δημιουργία κώδικα.
Η OpenAI καθυστέρησε αρχικά την κυκλοφορία των μοντέλων GPT της, επειδή φοβόταν ότι θα χρησιμοποιούνταν για κακόβουλους σκοπούς, όπως η παραγωγή ανεπιθύμητης αλληλογραφίας και παραπληροφόρησης. Αλλά στα τέλη του 2022, η εταιρεία ξεκίνησε το ChatGPT – ένα chatbot συνομιλίας που βασίζεται στο GPT-3.5 και στο οποίο θα μπορούσε να έχει πρόσβαση οποιοσδήποτε. Το λανσάρισμα του ChatGPT προκάλεσε φρενίτιδα στον κόσμο της τεχνολογίας, με τη Microsoft να το ακολουθεί σύντομα με το δικό της AI chatbot Bing (μέρος της μηχανής αναζήτησης Bing) και τη Google να προσπαθεί να το καλύψει.
Όπως είχε προβλεφθεί, η ευρύτερη διαθεσιμότητα αυτών των γλωσσικών μοντέλων ΤΝ δημιούργησε προβλήματα και προκλήσεις. Το εκπαιδευτικό σύστημα εξακολουθεί να προσαρμόζεται στην ύπαρξη λογισμικού που γράφει αξιοσέβαστα δοκίμια για το κολέγιο- διαδικτυακοί ιστότοποι όπως το Stack Overflow και το περιοδικό επιστημονικής φαντασίας Clarkesworld αναγκάστηκαν να κλείσουν τις υποβολές λόγω της εισροής περιεχομένου που παράγεται από τεχνητή νοημοσύνη- και οι πρώτες χρήσεις των εργαλείων γραφής τεχνητής νοημοσύνης στη δημοσιογραφία ήταν στην καλύτερη περίπτωση βραχώδεις. Ωστόσο, ορισμένοι εμπειρογνώμονες υποστηρίζουν ότι οι βλαβερές συνέπειες ήταν ακόμη λιγότερες από τις αναμενόμενες.
Στην ανακοίνωσή της για το GPT-4, η OpenAI τόνισε ότι το σύστημα είχε περάσει από εξάμηνη εκπαίδευση ασφαλείας, και ότι σε εσωτερικές δοκιμές, ήταν “82% λιγότερο πιθανό να απαντήσει σε αιτήματα για μη επιτρεπτό περιεχόμενο και 40% πιο πιθανό να παράγει πραγματικές απαντήσεις από το GPT-3.5”.
Ωστόσο, αυτό δεν σημαίνει ότι το σύστημα δεν κάνει λάθη ή δεν παράγει επιβλαβές περιεχόμενο. Για παράδειγμα, η Microsoft αποκάλυψε ότι το Bing chatbot τροφοδοτείται από την αρχή από το GPT-4 και πολλοί χρήστες κατάφεραν να παραβιάσουν τις προστατευτικές μπάρες του Bing με κάθε είδους δημιουργικούς τρόπους, κάνοντας το bot να προσφέρει επικίνδυνες συμβουλές, να απειλεί τους χρήστες και να επινοεί πληροφορίες. Το GPT-4 εξακολουθεί επίσης να μην έχει γνώση για γεγονότα “που συνέβησαν μετά τη διακοπή της συντριπτικής πλειοψηφίας των δεδομένων του” τον Σεπτέμβριο του 2021