Μικρότερες εκδόσεις του Llama 3 διέθεσε στο κοινό η Meta

Αλέξης Σολωμός 18/04/2024 09:07 μμ

Η κίνηση εντάσσεται στο ευρύτερο πλαίσιο των προσπαθειών που καταβάλει η εταιρία να καλύψει την απόσταση που τη χωρίζει από την OpenAI.

H Meta κυκλοφόρησε την Πέμπτη δύο μικρότερες εκδόσεις του νέου μεγάλου γλωσσικού μοντέλου που αναπτύσσει, με την επωνυμία Llama 3, ένα πρόγραμμα δημιουργίας εικόνων που ενημερώνει το υλικό που παρουσιάζει σε πραγματικό χρόνο, ενώ οι χρήστες πληκτρολογούν διευκρινιστικές οδηγίες.

Τα μοντέλα αυτά πρόκειται να ενσωματωθούν στον εικονικό βοηθό Meta AI, τον οποίο η εταιρία προωθεί ως τον πλέον εξελιγμένο μεταξύ των άλλων δωρεάν προτάσεων. Ο βοηθός θα αναλάβει σημαντικότερο ρόλο στο Facebook, το Instagram, το WhatsApp και το Messenger, ενώ θα αποκτήσει και δική του ιστοσελίδα, έτσι ώστε να ανταγωνιστεί αμεσότερα το ChatGPT που ανέπτυξε η OpenAI με τη στήριξη της Microsoft.

H ανακοίνωσε καταγράφεται σε μια περίοδο κατά την οποία η Meta επιχειρεί να προωθήσει προϊόντα δημιουργικής τεχνητής νοημοσύνης στα δισεκατομμύρια των χρηστών της, ώστε να διεκδικήσει τα πρωτεία από την OpenAI. Στο πλαίσιο αυτό, έχει προχωρήσει σε αναδιάταξη των υπολογιστικών υποδομών της και συνένωση παλαιότερα διακριτών ομάδων έρευνας και ανάπτυξης προϊόντων.

Ο τεχνολογικός κολοσσός εφοδίασε το Llama 3 με νέες δυνατότητες σύνταξης κώδικα και το εκπαίδευσε χρησιμοποιώντας αυτή τη φορά τόσο εικόνες όσο και κείμενα, αν και για την ώρα το μοντέλο θα παρουσιάζει μόνο γραπτά αποτελέσματα, όπως ανέφερε ο Διευθυντής Προϊόντων της Meta, Κρις Κοξ.

Περισσότερο προηγμένες λειτουργίες, όπως η δυνατότητα να συντάσσει μεγαλύτερα σχέδια, αποτελούμενα από πολλαπλά βήματα, θα ενσωματωθούν σε επόμενες εκδόσεις, όπως δήλωσε σε συνέντευξή του ο Κοξ. Οι εκδόσεις που η εταιρία σκοπεύει να κυκλοφορήσει μέσα στους επόμενους μήνες θα έχουν τη δυνατότητα να δημιουργούν τόσο κείμενα όσο και εικόνες.

Ο Κοξ ανέφερε επίσης πως η ενσωμάτωση εικόνων στην εκπαίδευση του Llama 3 θα βελτίωνε την ενημέρωση που πρόκειται να κυκλοφορήσει μέσα στο χρόνο για τα έξυπνα γυαλιά Ray-Ban Meta που ανέπτυξε η εταιρία σε συνεργασία με την Essilor Luxoticca, επιτρέποντας έτσι στο Meta AI να αναγνωρίζει αντικείμενα στα οποία εστιάζει ο άνθρωπος που φορά τα γυαλιά και να απαντά σε σχετικές ερωτήσεις.

Η Meta ανακοίνωσε επίσης μια νέα συνεργασία με την Alphabet, τη μητρική εταιρία της Google, ώστε να συμπεριλαμβάνονται αποτελέσματα αναζήτησης σε πραγματικό χρόνο στις απαντήσεις του βοηθού, συμπληρώνοντας έτσι την υφιστάμενη συμφωνία με το Bing της Microsoft.

O βοηθός Meta AI πρόκειται να διατεθεί σε διάφορες νέες αγορές εκτός ΗΠΑ με την ενημέρωση αυτή, μεταξύ των οποίων η Αυστραλία, ο Καναδάς, η Σιγκαπούρη, η Νιγηρία και το Πακιστάν. Η Meta "εξακολουθεί να αναζητά τον κατάλληλο τρόπο να φέρει την υπηρεσία αυτή στην Ευρώπη", ανέφερε ο Κοξ, καθώς η νομοθεσία της Ευρωπαϊκής Ένωσης είναι αυστηρότερη σε θέματα προστασίας της ιδιωτικότητας, ενώ το επερχόμενο νομοθετικό πλαίσιο ρύθμισης της τεχνητής νοημοσύνης αναμένεται να επιβάλλει όρους όπως η γνωστοποίηση των δεδομένων που έχουν χρησιμοποιηθεί για την εκπαίδευση των διαφόρων μοντέλων.

Ο Μαρκ Ζούκερμπεργκ έχει αναφέρει ότι η μεγαλύτερη έκδοση του Llama 3 αυτή τη στιγμή εκπαιδεύεται με 400 δισεκατομμύρια παραμέτρους και ήδη βαθμολογείται με 85 ΜΜLU, στην κλίμακα αξιολόγησης της ποιότητας των αποτελεσμάτων που αποδίδουν τα μοντέλα τεχνητής νοημοσύνης. Οι δύο μικρότερες εκδόσεις που κυκλοφορούν ενσωματώνουν 8 και 70 δισεκατομμύρια παραμέτρους αντίστοιχα, με το μεγαλύτερο από τα δύο αυτά μοντέλα να βαθμολογείται με περίπου 82 ΜΜLU.

Δημιουργοί εφαρμογών έχουν διαμαρτυρηθεί ότι η προηγούμενη έκδοση, το Llama 2, αδυνατούσε να αντιληφθεί βασικά πράγματα γύρω από το πλαίσιο μιας ερώτησης, συγχέοντας το πώς να "σκοτώσει" κανείς το χρόνο του, με αίτημα για οδηγίες διάπραξης φόνου. Αντίστοιχα προβλήματα αντιμετώπισε και η Google, καθώς πρόσφατα έθεσε σε αναστολή τη λειτουργία δημιουργίας εικόνων μέσω του Gemini AI, καθώς το μοντέλο επικρίθηκε για την εμφάνιση ανακριβών απεικονίσεων ιστορικών προσώπων.

Η Meta υποστηρίζει ότι περιόρισε αυτά τα προβλήματα στο Llama 3 με τη χρήση "υψηλότερης ποιότητας δεδομένων" ώστε να μπορεί το μοντέλο να διακρίνει λεπτές νοηματικές διαφορές. Η εταιρία δεν διευκρίνισε τι είδους σύνολα δεδομένων ενσωμάτωσε, όμως ανέφερε πως τροφοδότησε το Llama 3 με επτά φορές περισσότερα δεδομένα από ό,τι το Llama 2 και ότι αξιοποίησε "συνθετικά" δεδομένα, δημιουργημένα από τεχνητή νοημοσύνη, προκειμένου να ενισχύσει τα αποτελέσματα του μοντέλου σε τομείς όπως η σύνταξη κώδικα και η εξαγωγή λογικών συμπερασμάτων.