Προς το περιεχόμενο

Βελτιώνεται το Code Llama, το δωρεάν προγραμματιστικό εργαλείο της Meta


nchatz

Προτεινόμενες αναρτήσεις

Το Code Llama 70B είναι σε θέση να δημιουργεί και να ελέγχει για αστοχίες μεγαλύτερες σειρές προγραμματισμού από ό,τι τα προηγούμενα μοντέλα

Συνεχίζονται οι προσπάθειες της Meta να βελτιώσει τα εργαλεία τεχνητής νοημοσύνης που αναπτύσσει εδώ αρκετό καιρό.

H πρόσφατη ενημέρωση που διέθεσε η Meta για το προγραμματιστικό μοντέλο της με χρήση τεχνητής νοημοσύνης, το Code Llama70B, είναι "το μεγαλύτερο μοντέλο με τις καλύτερες επιδόσεις μέχρι στιγμής". Τα εργαλεία Code Llama κυκλοφόρησαν τον Αύγουστο και διατίθενται δωρεάν τόσο για ερευνητικούς όσο και εμπορικούς σκοπούς. Σύμφωνα με ανάρτηση στο ιστολόγιο της Meta, το Code Llama 70B είναι σε θέση να χειρίζεται περισσότερα ερωτήματα από ό,τι οι προηγούμενες εκδόσεις, πράγμα που σημαίνει ότι οι developers μπορούν να το τροφοδοτούν με περισσότερες εντολές ενώ ο προγραμματισμός βρίσκεται σε εξέλιξη, και το μοντέλο αποδίδει καλύτερα.

Το Code Llama 70B βαθμολογήθηκε με 53 στην ακρίβεια από το HumanEval, καταγράφοντας καλύτερες επιδόσεις σε σχέση με το 48,1 που σημείωσε το GPT-3.5 ενώ πλησίασε περισσότερο στο 67% που είναι ο βαθμός τον οποίο κατέκτησε το GPT4, σύμφωνα με προηγούμενο έγγραφο της OpenAI. 

Βασισμένο στο Llama 2, το Code Llama βοηθά τους developers να δημιουργήσουν γραμμές κώδικα χρησιμοποιώντας εντολές και να ελέγξει για τυχόν σφάλματα κώδικα που έχει γραφεί από ανθρώπους. Υπενθυμίζεται ότι η Meta διέθεσε δύο άλλα εργαλεία της σειράς Code Llama το περασμένο φθινόπωρο, το Code Llama-Python και το Code Llama-Instruct, τα οποία εστιάζουν στις συγκεκριμένες γλώσσες προγραμματισμού.

Το Code Llama 70B είναι διαθέσιμο σε τρεις εκδόσεις και εξακολουθεί να προσφέρεται δωρεάν για ερευνητικούς και εμπορικούς σκοπούς. Το μεγάλο μοντέλο εκπαιδεύτηκε χρησιμοποιώντας 1ΤΒ κώδικα και συναφών δεδομένων. Φιλοξενείται στο Hugging Face, χώρο αποθήκευσης προγραμμάτων, που προσφέρει πρόσβαση σε GPU ώστε να τρέχουν μοντέλα τεχνητής νοημοσύνης.

Η Meta ανέφερε ότι τα μεγαλύτερα μοντέλα, το 34Β και το 70Β "επιστρέφουν τα καλύτερα αποτελέσματα και παρέχουν βελτιωμένη προγραμματιστική συνδρομή".

Μέσα στο 2023, άλλες εταιρίες που ασχολούνται με την ανάπτυξη μοντέλων τεχνητής νοημοσύνης διέθεσαν αντίστοιχα εργαλεία δημιουργίας κώδικα. Το CodeWhisperer της Amazon κυκλοφόρησε τον Απρίλιο, ενώ η Microsoft αξιοποίησε το μοντέλο της OpenAI προκειμένου να παρουσιάσει το Copilot.


Διαβάστε ολόκληρο το άρθρο

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Καλό αλλά έχει πολλές απαιτήσεις.
Χρειάζεται 140GB μνήμης. Το έτρεξα με συνδυασμό GPU και CPU. Οριακά τρέχει με context length 16k το οποίο είναι πολύ λίγο για προχωρημένου επιπέδου κώδικα.

Πρέπει να αρχίσει η nvidia να βγάζει gpu με περισσότερη μνήμη σε commercial σειρές.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

2 ώρες πριν, thomasG4 είπε

Όποιος θέλει να το δοκιμάσει μπορεί εδώ εντελώς δωρεάν:

image.png.aab994eef25ea678fc3ca28fb79a3325.png

https://labs.perplexity.ai/

Φίλη/ε που έδωσες αυτό το link !! Έκανα δουλειά ημερών πάνω σε javascript σε μισή ώρα. 

Ευχαριστώ.

Θα μας αντικαταστήσουν εμάς τους web developers οι A.I.

424624609_343784915234406_339852053105956427_n.jpg

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

10 hours ago, octa said:

Φίλη/ε που έδωσες αυτό το link !! Έκανα δουλειά ημερών πάνω σε javascript σε μισή ώρα. 

Ευχαριστώ.

Θα μας αντικαταστήσουν εμάς τους web developers οι A.I.

424624609_343784915234406_339852053105956427_n.jpg

Και το chatgpt είναι άσος στον προγραμματισμό

 

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα
  • Δημιουργία νέου...