Axlmon Δημοσ. 21 Απριλίου Δημοσ. 21 Απριλίου Η ερευνητική ομάδα της Yandex, σε συνεργασία με ερευνητές από το MIT, το ISTA και το KAUST, ανέπτυξε μια μέθοδο ταχείας συμπίεσης μεγάλων γλωσσικών μοντέλων χωρίς σημαντική απώλεια Η ερευνητική ομάδα της Yandex, σε συνεργασία με ερευνητές από το Τεχνολογικό Ινστιτούτο της Μασαχουσέτης (MIT), το Αυστριακό Ινστιτούτο Επιστήμης και Τεχνολογίας (ISTA) και το Πανεπιστήμιο Επιστήμης και Τεχνολογίας King Abdullah (KAUST), ανέπτυξε μια μέθοδο ταχείας συμπίεσης μεγάλων γλωσσικών μοντέλων (LLMs) χωρίς σημαντική απώλεια ποιότητας. Η νέα μέθοδος, με την ονομασία HIGGS (Hadamard Incoherence with Gaussian MSE-optimal GridS), επιτρέπει τη συμπίεση (ποσοτικοποίηση) των LLMs σε λίγα μόλις λεπτά απευθείας σε smartphones ή φορητούς υπολογιστές, χωρίς την ανάγκη για βιομηχανικού επιπέδου υπολογιστική ισχύ ή ισχυρές GPU. Προηγουμένως, η ανάπτυξη μεγάλων γλωσσικών μοντέλων σε φορητές συσκευές απαιτούσε διαδικασία ποσοτικοποίησης που διαρκούσε από ώρες έως εβδομάδες και έπρεπε να εκτελεστεί σε βιομηχανικούς servers για να διατηρηθεί η καλή ποιότητα. Η HIGGS μειώνει τα εμπόδια για τη δοκιμή και την ανάπτυξη νέων μοντέλων σε συσκευές καταναλωτικού επιπέδου, όπως οικιακούς υπολογιστές και smartphones, καταργώντας την ανάγκη για βιομηχανική υπολογιστική ισχύ. Σύμφωνα με την ανακοίνωση, η καινοτόμος μέθοδος συμπίεσης προωθεί τη δέσμευση της εταιρείας να καταστήσει τα μεγάλα γλωσσικά μοντέλα προσιτά σε όλους, από μεγάλους παίκτες, μικρομεσαίες επιχειρήσεις και μη κερδοσκοπικούς οργανισμούς έως μεμονωμένους συνεισφέροντες, προγραμματιστές και ερευνητές. Πέρυσι, οι ερευνητές της Yandex συνεργάστηκαν με σημαντικά πανεπιστήμια επιστήμης και τεχνολογίας για να παρουσιάσουν δύο νέες μεθόδους συμπίεσης LLM: την Additive Quantization of Large Language Models (AQLM) και την PV-Tuning. Συνδυαστικά, αυτές οι μέθοδοι μπορούν να μειώσουν το μέγεθος του μοντέλου έως και 8 φορές διατηρώντας το 95% της ποιότητας απόκρισης. Η μέθοδος HIGGS επιτρέπει στους προγραμματιστές να μειώσουν το μέγεθος του μοντέλου χωρίς να θυσιάσουν την ποιότητα και να τα εκτελέσουν σε πιο οικονομικές συσκευές. Για παράδειγμα, αυτή η μέθοδος μπορεί να χρησιμοποιηθεί για τη συμπίεση LLMs όπως το DeepSeek R1 με 671B παραμέτρους και το Llama 4 Maverick με 400B παραμέτρους, τα οποία προηγουμένως μπορούσαν να ποσοτικοποιηθούν μόνο με σημαντική απώλεια ποιότητας. Η Yandex χρησιμοποιεί ήδη το HIGGS για την ανάπτυξη πρωτοτύπων και την επιτάχυνση της ανάπτυξης προϊόντων καθώς τα συμπιεσμένα μοντέλα επιτρέπουν ταχύτερες δοκιμές από τα πλήρους κλίμακας αντίστοιχά τους. Όπως αναφέρεται, η HIGGS συμπιέζει μεγάλα γλωσσικά μοντέλα χωρίς να απαιτεί πρόσθετα δεδομένα ή μεθόδους κλίσης, καθιστώντας την ποσοτικοποίηση πιο προσιτή και αποτελεσματική για ένα ευρύ φάσμα εφαρμογών και συσκευών. Η μέθοδος δοκιμάστηκε στα μοντέλα της οικογένειας LLaMA 3.1 και 3.2, καθώς και στα μοντέλα της οικογένειας Qwen. Τα πειράματα δείχνουν ότι η HIGGS ξεπερνά άλλες μεθόδους ποσοτικοποίησης χωρίς δεδομένα, συμπεριλαμβανομένων των NF4 και HQQ, όσον αφορά τον λόγο ποιότητας-μεγέθους. Οι προγραμματιστές και οι ερευνητές μπορούν ήδη να έχουν πρόσβαση στη μέθοδο στο Hugging Face ή να εξερευνήσουν την ερευνητική εργασία, η οποία είναι διαθέσιμη στο arXiv. Στο τέλος αυτού του μήνα, η ομάδα θα παρουσιάσει την εργασία τους στο NAACL, ένα από τα κορυφαία συνέδρια AI στον κόσμο. Πέρα από την ποσοτικοποίηση LLM, η Yandex έχει διαθέσει με ανοιχτό κώδικα διάφορα εργαλεία που βελτιστοποιούν τους πόρους που χρησιμοποιούνται στην εκπαίδευση LLM. Για παράδειγμα, η βιβλιοθήκη YaFSDP επιταχύνει την εκπαίδευση LLM έως και 25% και μειώνει τους πόρους GPU για εκπαίδευση έως και 20%. Νωρίτερα φέτος, οι προγραμματιστές της Yandex διέθεσαν ως λογισμικού ανοιχτού κώδικα το Perforator, ένα εργαλείο για συνεχή παρακολούθηση και ανάλυση serivers και εφαρμογών σε πραγματικό χρόνο, το οποίο βοηθά τις εταιρείες να μειώσουν το κόστος υποδομής έως και 20%. Διαβάστε ολόκληρο το άρθρο
grgz Δημοσ. 21 Απριλίου Δημοσ. 21 Απριλίου Καιρός είναι να φτιάξουν και το email να λειτουργεί σωστά. 1 1
JcD Δημοσ. 21 Απριλίου Δημοσ. 21 Απριλίου Η yandex δεν είναι εντός των κυρώσεων? Εντύπωση μου κάνει, απαγόρεψαν τον Τσαϊκόφσκι αλλά επιτρέπουν στο ΜΙΤ να δουλεύει με την yandex η οποία είναι άμεσα συνδεδεμένη με το ρωσικό κράτος. 3
anax111 Δημοσ. 21 Απριλίου Δημοσ. 21 Απριλίου 1 ώρα πριν, JcD είπε Η yandex δεν είναι εντός των κυρώσεων? Εντύπωση μου κάνει, απαγόρεψαν τον Τσαϊκόφσκι αλλά επιτρέπουν στο ΜΙΤ να δουλεύει με την yandex η οποία είναι άμεσα συνδεδεμένη με το ρωσικό κράτος. Κι εγώ αυτό σκέφτηκα μόλις το διάβασα. Και μετά σκέφτηκα τι ακριβώς κάνει η Yandex και μετά ξανασκέφτηκα την είδηση υπό τα νέα δεδομένα και κατάλαβα πολλά πράγματα. Και ο νοών νοείτω. 2
JcD Δημοσ. 21 Απριλίου Δημοσ. 21 Απριλίου 18 minutes ago, anax111 said: Κι εγώ αυτό σκέφτηκα μόλις το διάβασα. Και μετά σκέφτηκα τι ακριβώς κάνει η Yandex και μετά ξανασκέφτηκα την είδηση υπό τα νέα δεδομένα και κατάλαβα πολλά πράγματα. Και ο νοών νοείτω. Δεν καταλαβαίνω τι προσπαθεί να κάνει, αν μπορείς να εξηγήσεις θα ήμουν ευγνώμων!
anax111 Δημοσ. 21 Απριλίου Δημοσ. 21 Απριλίου 22 λεπτά πριν, JcD είπε Δεν καταλαβαίνω τι προσπαθεί να κάνει, αν μπορείς να εξηγήσεις θα ήμουν ευγνώμων! Μαζεύει δεδομένα. Αυτό κάνει η Yandex, , ότι κάνει και η Google. Kαι μάλιστα όλα τα δεδομένα των ρωσόφιλων ανά τον κόσμο. Και το γεγονός ότι συνεργάζεται με το ΜΙΤ σε τόσο υψηλό επίπεδο σημαίνει στην πραγματικότητα ότι Ρωσία και ΗΠΑ ανταλλάσσουν τα δεδομένα που τους ενδιαφέρουν. Από αυτό καταλαβαίνεις πολλά πράγματα. Προσωπικά το υποψιαζόμουν αλλά η συγκεκριμένη είδηση το επιβεβαιώνει. Εδώ ανταλλάσσαν πληροφορίες για τις χώρες δορυφόρους τους επί ψυχρού πολέμου τώρα θα σταματήσουν; 3
darkmatinee Δημοσ. 21 Απριλίου Δημοσ. 21 Απριλίου 2 hours ago, JcD said: Η yandex δεν είναι εντός των κυρώσεων? Εντύπωση μου κάνει, απαγόρεψαν τον Τσαϊκόφσκι αλλά επιτρέπουν στο ΜΙΤ να δουλεύει με την yandex η οποία είναι άμεσα συνδεδεμένη με το ρωσικό κράτος. Που απαγόρευσαν Τσαϊκόφσκι;
JcD Δημοσ. 21 Απριλίου Δημοσ. 21 Απριλίου 8 minutes ago, darkmatinee said: Που απαγόρευσαν Τσαϊκόφσκι; Το έγραψα λάθος, κάποιες ορχήστρες ανά τον κόσμο καθώς και το ελληνικό υπουργείο πολιτισμού αποφάσισαν να βγάλουν από το ρεπερτόριο τους έργα Ρώσων συνθετών, πέραν του ελληνικού υπουργείου δεν γνωρίζω αν ακυρώθηκε επίσημα από άλλο υπουργείο κάποιο ρωσικό έργο!
nvel Δημοσ. 21 Απριλίου Δημοσ. 21 Απριλίου 30 λεπτά πριν, JcD είπε το ελληνικό υπουργείο πολιτισμού αποφάσισαν να βγάλουν από το ρεπερτόριο τους έργα Ρώσων συνθετών Η κοα πάντως τον Ιανουάριο έπαιξε αυτό
JcD Δημοσ. 21 Απριλίου Δημοσ. 21 Απριλίου 10 minutes ago, nvel said: Η κοα πάντως τον Ιανουάριο έπαιξε αυτό Η μενδωνη το πήρε χαμπάρι? Γιατί με δική της εντολή είχε ακυρωθεί η λίμνη των κύκνων 😅 2
cr77 Δημοσ. 21 Απριλίου Δημοσ. 21 Απριλίου (επεξεργασμένο) 4 ώρες πριν, grgz είπε Καιρός είναι να φτιάξουν και το email να λειτουργεί σωστά. Έχουν ήδη ξεκινήσει το vibe coding της νέας έκδοσης. 😂 Επεξ/σία 21 Απριλίου από cr77
darkmatinee Δημοσ. 21 Απριλίου Δημοσ. 21 Απριλίου 1 hour ago, JcD said: Το έγραψα λάθος, κάποιες ορχήστρες ανά τον κόσμο καθώς και το ελληνικό υπουργείο πολιτισμού αποφάσισαν να βγάλουν από το ρεπερτόριο τους έργα Ρώσων συνθετών, πέραν του ελληνικού υπουργείου δεν γνωρίζω αν ακυρώθηκε επίσημα από άλλο υπουργείο κάποιο ρωσικό έργο! Πάλι μπούρδες λες. Διακόπηκε η συνεργασία με κρατικούς οργανισμούς του ρωσικού καθεστώτος. Τα έργα των Ρωσων καλλιτεχνών συνεχίζονται να παίζουν. 2
JcD Δημοσ. 21 Απριλίου Δημοσ. 21 Απριλίου 21 minutes ago, darkmatinee said: Πάλι μπούρδες λες. Διακόπηκε η συνεργασία με κρατικούς οργανισμούς του ρωσικού καθεστώτος. Τα έργα των Ρωσων καλλιτεχνών συνεχίζονται να παίζουν. Καλά κρασιά αδερφέ 😅 2
Athoz Δημοσ. 21 Απριλίου Δημοσ. 21 Απριλίου Ποσοτικοποίηση υποθέτω μεταφράζει το quantization, που μεταφράζεται σε κβαντοποίηση. Άρα πλέον τα κβαντισμενα μοντέλα από 32,16 bit σε 8-2 bit θα θέλουν πολύ μικρότερο χρόνο για να παραχθούν αλλά θα είναι τα ίδια με αυτά που υπάρχουν ήδη και δεν θα έχουν βελτιώσεις στην εφαρμογή τους.
darkmatinee Δημοσ. 21 Απριλίου Δημοσ. 21 Απριλίου 15 minutes ago, JcD said: Καλά κρασιά αδερφέ 😅 Α καλά ούτε ελληνικά δεν ξέρεις να διαβάζεις.
Προτεινόμενες αναρτήσεις
Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε
Πρέπει να είστε μέλος για να αφήσετε σχόλιο
Δημιουργία λογαριασμού
Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!
Δημιουργία νέου λογαριασμούΣύνδεση
Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.
Συνδεθείτε τώρα