Ο τεχνολογικός γίγαντας Google ανακοίνωσε την κυκλοφορία του Gemini, του μεγαλύτερου και πιο προηγμένου συστήματος τεχνητής νοημοσύνης (AI) για την κατανόηση και τη δημιουργία γλώσσας.

Φέροντας το χαρακτηρισμό ως  "ένα από τα μεγαλύτερα έργα σε επίπεδο επιστήμης και μηχανικής που έχει πραγματοποιήσει η εταιρεία", το Gemini αντιπροσωπεύει ένα τεράστιο άλμα στις δυνατότητες τεχνητής νοημοσύνης χάρη στον multimodal σχεδιασμό του. Είναι το αποτέλεσμα μεγάλης κλίμακας συνεργατικών προσπαθειών από ομάδες εντός της εταιρείας, συμπεριλαμβανομένων των Google DeepMind και Google Research.

Σε αντίθεση με προηγούμενα μοντέλα AI που επικεντρώνονται στο κείμενο, το Gemini έχει προ-εκπαιδευτεί από την αρχή σε πολλαπλούς τύπους δεδομένων, συμπεριλαμβανομένων εικόνων, βίντεο, ήχου και κώδικα. Αυτός ο εγγενής χειρισμός διαφορετικών τρόπων επιτρέπει στο Gemini να συνδυάζει απρόσκοπτα αυτές τις εισόδους για βελτιωμένες ικανότητες συλλογισμού, κατανόησης και παραγωγής.  Το λανσάρισμα περιλαμβάνει τρία μοντέλα Gemini διαφορετικού μεγέθους για διαφορετικά επίπεδα πολυπλοκότητας και περιπτώσεις χρήσης:

Gemini Ultra - η μεγαλύτερη παραλλαγή για σύνθετες εργασίες υψηλής ικανότητας, από την περίληψη ερευνητικών εργασιών έως τη δημιουργία νέων σχεδίων. 

Gemini Pro - βελτιστοποιημένο για αποτελεσματικό scaling στις περισσότερες εργασίες με ισχυρές συνολικές επιδόσεις.

Gemini Nano - το πιο συμπαγές και αποδοτικό μοντέλο που έχει σχεδιαστεί για να εκτελείται ακόμη και σε κινητές συσκευές.

Με εκτεταμένες συγκριτικές δοκιμές σε πάνω από 30 σύνολα δοκιμών, το Gemini παρέχει κορυφαία αποτελέσματα σχεδόν παντού - από μαθηματικούς συλλογισμούς έως εργασίες φυσικής γλώσσας. Αυτό σύμφωνα με την εταιρεία αποτελεί μια τεράστια ώθηση τόσο για τις καταναλωτικές όσο και για τις επιχειρηματικές εφαρμογές της AI τεχνολογίας, με τη Google να προχωρά και σε άμεση σύγκριση με το GPT-4 της OpenA, σε μια σειρά δοκιμών (κείμενο και multimodal) που μπορείτε να δείτε στις παρακάτω εικόνες.

image.png.2f24796265e64d96421ce050ae876578.png

image.png.9edc7d148cdd88c7c673e1e28dc3421b.png

Για τους μέσους χρήστες, το Gemini θα επεκταθεί σταδιακά για να ενισχύσει τις υπάρχουσες υπηρεσίες της Google, όπως η Αναζήτηση, το Chrome και η διαφήμιση. Εν τω μεταξύ, η προσπάθεια του AI chatbot της εταιρείας, "Bard", έχει αναβαθμιστεί ήδη  στο Gemini, βελτιώνοντας σημαντικά τις ικανότητες κατανόησης, συλλογισμού και δημιουργίας περιεχομένου σε περισσότερες από 170 χώρες.

Οι προγραμματιστές θα έχουν επίσης πρόσβαση στα μοντέλα Gemini μέσω του Google AI Studio, της πλατφόρμας Vertex AI και της ενσωμάτωσης του Android OS από την επόμενη εβδομάδα. Αυτό επιτρέπει την ταχεία δημιουργία πρωτοτύπων εφευρετικών συστημάτων AI που αξιοποιούν τις ευέλικτες δυνατότητες του Gemini. Επιλεγμένοι προγραμματιστές θα αποκτήσουν ακόμη και πρώιμη πρόσβαση για να πειραματιστούν με το πανίσχυρο μοντέλο Gemini Ultra.

Καθώς η έρευνα της Google συνεχίζει να εξελίσσει τις δεξιότητες του Gemini, η κυκλοφορία αυτή αποτελεί μια κομβική στιγμή για την τεχνητή νοημοσύνη στον πραγματικό κόσμο. Με τον multimodal σχεδιασμό του και το τεράστιο scaling του, το Gemini μπορεί σύντομα να εκπληρώσει την υπόσχεση ότι η τεχνητή νοημοσύνη θα βελτιώσει σχεδόν κάθε πτυχή της ζωής όπως αναφέρει και ο CEO της εταιρείας, Sundar Pichai.

 

  • Like 10
  • Confused 1