Το Code Llama 70B είναι σε θέση να δημιουργεί και να ελέγχει για αστοχίες μεγαλύτερες σειρές προγραμματισμού από ό,τι τα προηγούμενα μοντέλα

Συνεχίζονται οι προσπάθειες της Meta να βελτιώσει τα εργαλεία τεχνητής νοημοσύνης που αναπτύσσει εδώ αρκετό καιρό.

H πρόσφατη ενημέρωση που διέθεσε η Meta για το προγραμματιστικό μοντέλο της με χρήση τεχνητής νοημοσύνης, το Code Llama70B, είναι "το μεγαλύτερο μοντέλο με τις καλύτερες επιδόσεις μέχρι στιγμής". Τα εργαλεία Code Llama κυκλοφόρησαν τον Αύγουστο και διατίθενται δωρεάν τόσο για ερευνητικούς όσο και εμπορικούς σκοπούς. Σύμφωνα με ανάρτηση στο ιστολόγιο της Meta, το Code Llama 70B είναι σε θέση να χειρίζεται περισσότερα ερωτήματα από ό,τι οι προηγούμενες εκδόσεις, πράγμα που σημαίνει ότι οι developers μπορούν να το τροφοδοτούν με περισσότερες εντολές ενώ ο προγραμματισμός βρίσκεται σε εξέλιξη, και το μοντέλο αποδίδει καλύτερα.

Το Code Llama 70B βαθμολογήθηκε με 53 στην ακρίβεια από το HumanEval, καταγράφοντας καλύτερες επιδόσεις σε σχέση με το 48,1 που σημείωσε το GPT-3.5 ενώ πλησίασε περισσότερο στο 67% που είναι ο βαθμός τον οποίο κατέκτησε το GPT4, σύμφωνα με προηγούμενο έγγραφο της OpenAI. 

Βασισμένο στο Llama 2, το Code Llama βοηθά τους developers να δημιουργήσουν γραμμές κώδικα χρησιμοποιώντας εντολές και να ελέγξει για τυχόν σφάλματα κώδικα που έχει γραφεί από ανθρώπους. Υπενθυμίζεται ότι η Meta διέθεσε δύο άλλα εργαλεία της σειράς Code Llama το περασμένο φθινόπωρο, το Code Llama-Python και το Code Llama-Instruct, τα οποία εστιάζουν στις συγκεκριμένες γλώσσες προγραμματισμού.

Το Code Llama 70B είναι διαθέσιμο σε τρεις εκδόσεις και εξακολουθεί να προσφέρεται δωρεάν για ερευνητικούς και εμπορικούς σκοπούς. Το μεγάλο μοντέλο εκπαιδεύτηκε χρησιμοποιώντας 1ΤΒ κώδικα και συναφών δεδομένων. Φιλοξενείται στο Hugging Face, χώρο αποθήκευσης προγραμμάτων, που προσφέρει πρόσβαση σε GPU ώστε να τρέχουν μοντέλα τεχνητής νοημοσύνης.

Η Meta ανέφερε ότι τα μεγαλύτερα μοντέλα, το 34Β και το 70Β "επιστρέφουν τα καλύτερα αποτελέσματα και παρέχουν βελτιωμένη προγραμματιστική συνδρομή".

Μέσα στο 2023, άλλες εταιρίες που ασχολούνται με την ανάπτυξη μοντέλων τεχνητής νοημοσύνης διέθεσαν αντίστοιχα εργαλεία δημιουργίας κώδικα. Το CodeWhisperer της Amazon κυκλοφόρησε τον Απρίλιο, ενώ η Microsoft αξιοποίησε το μοντέλο της OpenAI προκειμένου να παρουσιάσει το Copilot.

  • Like 3
  • Thanks 2