Μετά από μήνες φημών και εικασιών, η OpenAI ανακοίνωσε το GPT-4: το τελευταίο στη σειρά γλωσσικών μοντέλων AI που τροφοδοτούν εφαρμογές όπως το ChatGPT και το νέο Bing.

Η εταιρεία ισχυρίζεται ότι το μοντέλο είναι "πιο δημιουργικό και συνεργατικό από ποτέ" και "μπορεί να λύσει δύσκολα προβλήματα με μεγαλύτερη ακρίβεια". Μπορεί να αναλύσει τόσο κείμενο όσο και εικόνες, αν και μπορεί να απαντήσει μόνο μέσω κειμένου. Η OpenAI προειδοποιεί επίσης ότι τα συστήματα διατηρούν πολλά από τα προβλήματα που είδαμε με τα προηγούμενα γλωσσικά μοντέλα, συμπεριλαμβανομένης της τάσης να επινοούν πληροφορίες και της ικανότητας να δημιουργούν βίαια και επιβλαβή κείμενα.

Η OpenAI αναφέρει ότι έχει ήδη συνεργαστεί με διάφορες εταιρείες για την ενσωμάτωση του GPT-4 στα προϊόντα τους, συμπεριλαμβανομένων των Duolingo, Stripe και Khan Academy. Το νέο μοντέλο είναι διαθέσιμο στο ευρύ κοινό μέσω του ChatGPT Plus, της μηνιαίας συνδρομής ChatGPT της OpenAI αξίας 20 δολαρίων, ενώ σήμερα μάθαμε ότι είναι αυτό που τροφοδοτεί το chatbot του Bing της Microsoft από την πρώτη μέρα κυκλοφορίας του. Θα είναι επίσης προσβάσιμο ως API για προγραμματιστές που θα μπορούν να βασιστούν σε αυτό, με τη σχετική λίστα αναμονής να υπάρχει εδώ.

Στο αναλυτικό blog post, η OpenAI ανέφερε ότι η διάκριση μεταξύ του GPT-4 και του προκατόχου του GPT-3.5 είναι "λεπτή" σε περιστασιακή συζήτηση (το GPT-3.5 είναι το μοντέλο που τροφοδοτεί το ChatGPT). Ο διευθύνων σύμβουλος της OpenAI, Sam Altman, έγραψε στο Twitter ότι το GPT-4 «εξακολουθεί να είναι ελαττωματικό, εξακολουθεί να είναι περιορισμένο», αλλά ότι επίσης «εξακολουθεί να φαίνεται πιο εντυπωσιακό κατά την πρώτη χρήση από ό,τι όταν περάσετε περισσότερο χρόνο μαζί του».

Η εταιρεία αναφέρει ότι οι βελτιώσεις του GPT-4 είναι εμφανείς στις επιδόσεις του συστήματος σε μια σειρά από τεστ και συγκριτικά στοιχεία, συμπεριλαμβανομένων των εξετάσεων Uniform Bar Exam, LSAT, SAT Math και SAT Evidence-Based Reading & Writing. Στις εξετάσεις που αναφέρθηκαν, το GPT-4 σημείωσε βαθμολογία στο 88ο εκατοστημόριο και άνω, ενώ μια πλήρη λίστα με τις εξετάσεις και τις βαθμολογίες του συστήματος μπορείτε να δείτε εδώ.

Οι εικασίες σχετικά με το GPT-4 και τις δυνατότητές του ήταν έντονες τον τελευταίο χρόνο, με πολλούς να υποδηλώνουν ότι θα αποτελούσε τεράστιο άλμα σε σχέση με τα προηγούμενα συστήματα. Ωστόσο, αν κρίνουμε από την ανακοίνωση του OpenAI, κάτι τέτοιο δεν ισχύει όπως είχε προειδοποιήσει παλιότερα η εταιρεία. «Ο κόσμος θέλει να απογοητευτεί και θα απογοητευτεί», δήλωσε ο Altman σε συνέντευξή του για το GPT-4 τον Ιανουάριο. 

Οι φήμες αναζωπυρώθηκαν την περασμένη εβδομάδα όταν ένα στέλεχος της Microsoft άφησε να διαρρεύσει ότι το σύστημα θα κυκλοφορήσει αυτή την εβδομάδα σε συνέντευξή του στον γερμανικό Τύπο. Το στέλεχος πρότεινε επίσης ότι το σύστημα θα είναι multimodal, δηλαδή θα μπορεί να παράγει όχι μόνο κείμενο αλλά και άλλο περιεχόμενο. Πολλοί ερευνητές της τεχνητής νοημοσύνης πιστεύουν ότι τα multimodal συστήματα που ενσωματώνουν κείμενο, ήχο και βίντεο προσφέρουν τον καλύτερο δρόμο προς τη δημιουργία πιο ικανών συστημάτων τεχνητής νοημοσύνης.

Το GPT-4 είναι ένα από αυτά, αλλά υποστηρόζοντας λιγότερα μέσα από όσα κάποιοι προέβλεπαν. Η OpenAI αναφέρει ότι το σύστημα μπορεί να δεχτεί κείμενο και εικόνα, ενώ παράγει μόνο κείμενο. Η εταιρεία λέει ακόμα ότι η ικανότητα του μοντέλου να αναλύει κείμενο και εικόνα ταυτόχρονα του επιτρέπει να ερμηνεύει πιο σύνθετα ερωτήματα. Στα δείγματα που ακολουθούν, μπορείτε να δείτε το σύστημα να εξηγεί memes (μιμίδια) και ασυνήθιστες εικόνες:

Screenshot_2023_03_14_at_17_13_45.webp.4d5f37b321e34c9a45e8eb8c4852da51.webp

download.jpeg.6314484c042731cf2b3b94d4230c76ff.jpeg Screenshot_2023_03_14_at_17_13_31.webp.f6e6cfa3eb4befb2010b8deee731bcb3.webp

Ήταν ένα μακρύ ταξίδι για να φτάσουμε στο GPT-4, με το OpenAI - και τα γλωσσικά μοντέλα τεχνητής νοημοσύνης γενικότερα - να αναπτύσσουν αργά τη δυναμική τους για αρκετά χρόνια, προτού εκτοξευθούν σε δημοτικότητα τους τελευταίους μήνες.

Η αρχική ερευνητική εργασία που περιγράφει το GPT δημοσιεύθηκε το 2018, με το GPT-2 να ανακοινώνεται το 2019 και το GPT-3 το 2020. Τα μοντέλα αυτά εκπαιδεύονται σε τεράστια σύνολα δεδομένων κειμένου, το μεγαλύτερο μέρος του οποίου προέρχεται από το διαδίκτυο, το οποίο αναλύεται για την εξεύρεση στατιστικών μοτίβων. Αυτά τα μοτίβα χρησιμοποιούνται στη συνέχεια για να προβλέψουν ποια λέξη ακολουθεί μια άλλη. Είναι ένας σχετικά απλός μηχανισμός για να περιγραφεί, αλλά το τελικό αποτέλεσμα είναι ευέλικτα συστήματα που μπορούν να παράγουν, να συνοψίζουν και να επαναδιατυπώνουν γραπτά, καθώς και να εκτελούν άλλες εργασίες που βασίζονται στο κείμενο, όπως η μετάφραση ή η δημιουργία κώδικα.

Η OpenAI καθυστέρησε αρχικά την κυκλοφορία των μοντέλων GPT της, επειδή φοβόταν ότι θα χρησιμοποιούνταν για κακόβουλους σκοπούς, όπως η παραγωγή ανεπιθύμητης αλληλογραφίας και παραπληροφόρησης. Όμως στα τέλη του 2022, η εταιρεία ξεκίνησε το ChatGPT - ένα chatbot συνομιλίας που βασίζεται στο GPT-3.5 και στο οποίο θα μπορούσε να έχει πρόσβαση οποιοσδήποτε. Το λανσάρισμα του ChatGPT προκάλεσε φρενίτιδα στον κόσμο της τεχνολογίας, με τη Microsoft να το ακολουθεί σύντομα με το δικό της AI chatbot Bing (μέρος της μηχανής αναζήτησης Bing) και τη Google να ακολουθεί με τη δική της πρόταση.

Όπως είχε προβλεφθεί, η ευρύτερη διαθεσιμότητα αυτών των γλωσσικών μοντέλων Τεχνητής Νοημοσύνης (ΤΝ) δημιούργησε προβλήματα και προκλήσεις. Το εκπαιδευτικό σύστημα εξακολουθεί να προσαρμόζεται στην ύπαρξη λογισμικού που γράφει αξιόλογα δοκίμια για το κολέγιο. Επιπλέον διαδικτυακοί ιστότοποι όπως το Stack Overflow και το περιοδικό επιστημονικής φαντασίας Clarkesworld αναγκάστηκαν να κλείσουν τις υποβολές λόγω της εισροής περιεχομένου που παράγεται από τεχνητή νοημοσύνη ενώ οι πρώτες χρήσεις των εργαλείων γραφής τεχνητής νοημοσύνης στη δημοσιογραφία ήταν στην καλύτερη περίπτωση προβληματικές. Ωστόσο, ορισμένοι εμπειρογνώμονες υποστηρίζουν ότι οι βλαβερές συνέπειες ήταν ακόμη λιγότερες από τις αναμενόμενες.

Στην ανακοίνωσή της για το GPT-4, η OpenAI τόνισε ότι το σύστημα είχε περάσει από εξάμηνη εκπαίδευση ασφαλείας, και ότι σε εσωτερικές δοκιμές, ήταν "82% λιγότερο πιθανό να απαντήσει σε αιτήματα για μη επιτρεπτό περιεχόμενο και 40% πιο πιθανό να παράγει πραγματικές απαντήσεις από το GPT-3.5".

Ωστόσο, αυτό δεν σημαίνει ότι το σύστημα δεν κάνει λάθη ή δεν παράγει επιβλαβές περιεχόμενο. Για παράδειγμα, η Microsoft αποκάλυψε ότι το Bing chatbot τροφοδοτείται από την αρχή της λειτουργίας του από το GPT-4 και πολλοί χρήστες κατάφεραν να παραβιάσουν τις προστατευτικές δικλείδες του Bing με κάθε είδους δημιουργικούς τρόπους, κάνοντας το bot να προσφέρει επικίνδυνες συμβουλές, να απειλεί τους χρήστες και να επινοεί πληροφορίες. Το GPT-4 εξακολουθεί επίσης να μην έχει γνώση για γεγονότα "που συνέβησαν μετά τη διακοπή της συντριπτικής πλειοψηφίας των δεδομένων του" τον Σεπτέμβριο του 2021.

  • Like 7
  • Thanks 1