Αναζήτηση στην κοινότητα
Εμφάνιση αποτελεσμάτων για τις ετικέτες 'Gemini'.
14 αποτελέσματα
-
Η διαρροή αυτής της εξέλιξης οδήγησε σε αύξηση της τιμής της μετοχής της Alphabet κατά 6%, ενώ η μετοχή της Apple κατέγραψε αύξηση της τάξης του 2,5% Σύμφωνα με ρεπορτάζ του Bloomberg, η Apple διαπραγματεύεται την ενσωμάτωση του μοντέλου τεχνητής νοημοσύνης Gemini, το οποίο αναπτύσσει η Google, στα iPhone. Οι διαπραγματεύσεις αφορούν την απόκτηση του δικαιώματος χρήσης του Gemini για ορισμένες νέες λειτουργίες οι οποίες πρόκειται να ενσωματωθούν στο λογισμικό των iPhone μέσα στο τρέχον έτος, σύμφωνα με το ίδιο ρεπορτάζ, αν και οι ακριβείς όροι της συμφωνίας καθώς και του πώς θα εφαρμοζόταν στην πράξη δεν έχουν διευκρινιστεί ακόμη. Σε κάθε περίπτωση, θεωρείται απίθανο να ανακοινωθεί η όποια οριστική συμφωνία πριν τον Ιούνιο, οπότε η Apple σχεδιάζει να διοργανώσει το ετήσιο συνέδριο developers, ενώ πρόσφατα ο τεχνολογικός κολοσσός είχε συζητήσεις και με την OpenΑΙ, την εταιρία πίσω από το ChatGPT, και πάλι σχετικά με το ενδεχόμενο να χρησιμοποιήσει το δικό της μοντέλο τεχνητής νοημοσύνης, σύμφωνα με το ίδιο ρεπορτάζ. Kαμία από τις τρεις εταιρίες που κατονομάζονται στο ρεπορτάζ δεν θέλησε να προβεί σε κάποιο σχόλιο. Μια πιθανή συμφωνία μεταξύ Apple και Google θα βοηθούσε τη δεύτερη να διευρύνει τη χρήση των υπηρεσιών τεχνητής νοημοσύνης που αναπτύσσει, καθώς οι ενεργές συσκευές Apple υπερβαίνουν τα 2 δισεκατομμύρια, ενισχύοντας με τον τρόπο αυτό τις προσπάθειες της εταιρίας να συναγωνιστεί την OpenAI, η οποία έχει τη στήριξη της Microsoft. Παράλληλα, θα βοηθούσε να κατευναστούν οι ανησυχίες των επενδυτών σχετικά με την καθυστέρηση που καταγράφεται στην κυκλοφορία εφαρμογών τεχνητής νοημοσύνης από την Apple, η οποία έχασε το στέμμα της εταιρίας με την υψηλότερη χρηματιστηριακή αποτίμηση διεθνών, καθώς η μετοχή της κατέγραψε απώλειες της τάξης του 10% μέσα στο 2023. Apple και Google έχουν ήδη πολυετή συνεργασία, που επιτρέπει στην εφαρμογή αναζήτησης της Google να είναι η προεπιλεγμένη πρόταση στο Safari της Apple, ενώ μια συνεργασία και σε επίπεδο τεχνητής νοημοσύνης θα μπορούσε να βοηθήσει την Alphabet να αποκρούσει τις όποιες ανησυχίες ότι υπηρεσίες όπως το ChatGPT θα μπορούσαν να απειλήσουν την πρωτοκαθεδρία της Google στον τομέα της αναζήτησης πληροφορίων στο διαδίκτυο. Δεν αποκλείεται, όμως, τυχόν συμφωνία να προκαλέσει το ενδιαφέρον των ρυθμιστικών αρχών των ΗΠΑ, που ήδη έχουν κινηθεί νομικά σε βάρος της Google, εγκαλώντας τη ότι περιορίζει παράνομα τον ανταγωνισμό, καταβάλλοντας στην Apple δισεκατομμύρια δολάρια, προκειμένου να διατηρήσει την κυρίαρχη θέση της στον τομέα των αναζητήσεων. Υπενθυμίζεται ότι τον Ιανουάριο η Google συνεργάστηκε με τη Samsung, εκ των βασικών ανταγωνιστών της Apple, προκειμένου να ενσωματωθεί το μοντέλο τεχνητής νοημοσύνης που αναπτύσσει η εταιρία στη σειρά Galaxy S24, τη νέα ναυαρχίδα της νοτιοκορεατικής εταιρίας, στο πλαίσιο των προσπαθειών να ενισχυθεί η χρήση του Gemini, μετά από διάφορες αστοχίες που καταγράφηκαν στα αρχικά στάδια της διάθεσής του στην αγορά. Σε δηλώσεις του τον περασμένο μήνα, ο διευθύνων σύμβουλος της Apple, Τιμ Κουκ, ανέφερε ότι η εταιρία πραγματοποιούσε "σημαντικές" επενδύσεις στη δημιουργική τεχνητή νοημοσύνη και σχεδίαζε να ανακοινώσει περισσότερες λεπτομέρειες γύρω από τα σχέδιά της για την εφαρμογή της τεχνολογίας αυτής αργότερα μέσα στο τρέχον έτος. Σύμφωνα πάντοτε με το ρεπορτάζ του Bloomeberg, η Apple σχεδίαζε να χρησιμοποιήσει τα μοντέλα τεχνητής νοημοσύνης που η ίδια ανέπτυσσε στο επερχόμενο iOS 18, όμως αναζητούσε συνεργασίες για τις λειτουργίες δημιουργικής τεχνητής νοημοσύνης, μεταξύ άλλων τη δυνατότητα δημιουργίας εικόνων αλλά και τη σύνταξη εκθέσεων, βασισμένων σε απλές οδηγίες. Διαβάστε ολόκληρο το άρθρο
-
Σύμφωνα με ρεπορτάζ του Bloomberg, η Apple διαπραγματεύεται την ενσωμάτωση του μοντέλου τεχνητής νοημοσύνης Gemini, το οποίο αναπτύσσει η Google, στα iPhone. Οι διαπραγματεύσεις αφορούν την απόκτηση του δικαιώματος χρήσης του Gemini για ορισμένες νέες λειτουργίες οι οποίες πρόκειται να ενσωματωθούν στο λογισμικό των iPhone μέσα στο τρέχον έτος, σύμφωνα με το ίδιο ρεπορτάζ, αν και οι ακριβείς όροι της συμφωνίας καθώς και του πώς θα εφαρμοζόταν στην πράξη δεν έχουν διευκρινιστεί ακόμη. Σε κάθε περίπτωση, θεωρείται απίθανο να ανακοινωθεί η όποια οριστική συμφωνία πριν τον Ιούνιο, οπότε η Apple σχεδιάζει να διοργανώσει το ετήσιο συνέδριο developers, ενώ πρόσφατα ο τεχνολογικός κολοσσός είχε συζητήσεις και με την OpenΑΙ, την εταιρία πίσω από το ChatGPT, και πάλι σχετικά με το ενδεχόμενο να χρησιμοποιήσει το δικό της μοντέλο τεχνητής νοημοσύνης, σύμφωνα με το ίδιο ρεπορτάζ. Kαμία από τις τρεις εταιρίες που κατονομάζονται στο ρεπορτάζ δεν θέλησε να προβεί σε κάποιο σχόλιο. Μια πιθανή συμφωνία μεταξύ Apple και Google θα βοηθούσε τη δεύτερη να διευρύνει τη χρήση των υπηρεσιών τεχνητής νοημοσύνης που αναπτύσσει, καθώς οι ενεργές συσκευές Apple υπερβαίνουν τα 2 δισεκατομμύρια, ενισχύοντας με τον τρόπο αυτό τις προσπάθειες της εταιρίας να συναγωνιστεί την OpenAI, η οποία έχει τη στήριξη της Microsoft. Παράλληλα, θα βοηθούσε να κατευναστούν οι ανησυχίες των επενδυτών σχετικά με την καθυστέρηση που καταγράφεται στην κυκλοφορία εφαρμογών τεχνητής νοημοσύνης από την Apple, η οποία έχασε το στέμμα της εταιρίας με την υψηλότερη χρηματιστηριακή αποτίμηση διεθνών, καθώς η μετοχή της κατέγραψε απώλειες της τάξης του 10% μέσα στο 2023. Apple και Google έχουν ήδη πολυετή συνεργασία, που επιτρέπει στην εφαρμογή αναζήτησης της Google να είναι η προεπιλεγμένη πρόταση στο Safari της Apple, ενώ μια συνεργασία και σε επίπεδο τεχνητής νοημοσύνης θα μπορούσε να βοηθήσει την Alphabet να αποκρούσει τις όποιες ανησυχίες ότι υπηρεσίες όπως το ChatGPT θα μπορούσαν να απειλήσουν την πρωτοκαθεδρία της Google στον τομέα της αναζήτησης πληροφορίων στο διαδίκτυο. Δεν αποκλείεται, όμως, τυχόν συμφωνία να προκαλέσει το ενδιαφέρον των ρυθμιστικών αρχών των ΗΠΑ, που ήδη έχουν κινηθεί νομικά σε βάρος της Google, εγκαλώντας τη ότι περιορίζει παράνομα τον ανταγωνισμό, καταβάλλοντας στην Apple δισεκατομμύρια δολάρια, προκειμένου να διατηρήσει την κυρίαρχη θέση της στον τομέα των αναζητήσεων. Υπενθυμίζεται ότι τον Ιανουάριο η Google συνεργάστηκε με τη Samsung, εκ των βασικών ανταγωνιστών της Apple, προκειμένου να ενσωματωθεί το μοντέλο τεχνητής νοημοσύνης που αναπτύσσει η εταιρία στη σειρά Galaxy S24, τη νέα ναυαρχίδα της νοτιοκορεατικής εταιρίας, στο πλαίσιο των προσπαθειών να ενισχυθεί η χρήση του Gemini, μετά από διάφορες αστοχίες που καταγράφηκαν στα αρχικά στάδια της διάθεσής του στην αγορά. Σε δηλώσεις του τον περασμένο μήνα, ο διευθύνων σύμβουλος της Apple, Τιμ Κουκ, ανέφερε ότι η εταιρία πραγματοποιούσε "σημαντικές" επενδύσεις στη δημιουργική τεχνητή νοημοσύνη και σχεδίαζε να ανακοινώσει περισσότερες λεπτομέρειες γύρω από τα σχέδιά της για την εφαρμογή της τεχνολογίας αυτής αργότερα μέσα στο τρέχον έτος. Σύμφωνα πάντοτε με το ρεπορτάζ του Bloomeberg, η Apple σχεδίαζε να χρησιμοποιήσει τα μοντέλα τεχνητής νοημοσύνης που η ίδια ανέπτυσσε στο επερχόμενο iOS 18, όμως αναζητούσε συνεργασίες για τις λειτουργίες δημιουργικής τεχνητής νοημοσύνης, μεταξύ άλλων τη δυνατότητα δημιουργίας εικόνων αλλά και τη σύνταξη εκθέσεων, βασισμένων σε απλές οδηγίες.
-
H Google ανακοίνωσε μια μεγάλη σειρά βελτιώσεων για το Android, εγκαινιάζοντας την παρουσία της στη MWC φέτος, μεταξύ των οποίων περιλαμβάνεται η ενσωμάτωση του Gemini στο Messages, καθώς και γραπτές περιλήψεις δημιουργημένες από το μοντέλο τεχνητής νοημοσύνης, ενώσω ο χρήστης οδηγεί. Ήδη από αυτή την εβδομάδα, οι χρήστες του Messages θα έχουν πρόσβαση στο chatbot της Google χωρίς να χρειάζεται να βγουν από την εφαρμογή ανταλλαγής μηνυμάτων. Το Gemini στο Messages είναι σε θέση να διαχειριστεί απλές διαδικασίες, όπως τη σύνταξη μηνυμάτων και τη συνδρομή στην κατάρτηση ενός προγράμματος για το χρήστη ή απλά να αναλάβει το ρόλο του συνομιλητή, αν ο χρήστης το επιθυμεί. Η λειτουργία βρίσκεται ακόμη σε δοκιμαστικό στάδιο και είναι διαθέσιμη μόνο στην αγγλική γλώσσα, επί του παρόντος, όπως αναφέρει στην ανακοίνωσή της η Google. To Android Auto ενισχύεται επίσης με λειτουργίες τεχνητής νοημοσύνης που βοηθούν στην ελαχιστοποίηση των περισπάσεων από άτομα που σας στέλνουν μηνύματα ενώ οδηγείτε. Αν κάποια ομαδική συνομιλία κατακλύζει τη συσκευή σας με ατελείωτα μηνύματα ή αν κάποιος σας στέλνει ολόκληρα κατεβατά, το Android Auto αναλαμβάνει να προχωρήσει στην αυτόματη δημιουργία περιλήψεων και να σας διαβάζει τη συντομότερη αυτή εκδοχή. Παράλληλα, προτείνει απαντήσεις και ενέργειες, βασισμένες στα μηνύματα, όπως για παράδειγμα να ενημερώσετε για την εκτιμώμενη ώρα άφιξης, ώστε να μπορέσετε να απαντήσετε με ένα απλό άγγιγμα της οθόνης και να εστιάσετε στην οδήγηση. Η Google ανακοίνωσε επίσης ορισμένες νέες λειτουργίες για το Android στη MWC, συμπεριλαμβανομένης της δημιουργίας λεζάντων για εικόνες μέσω ΑΙ στην εφαρμογή Lookout. Έτσι, θα υπάρχει η δυνατότητα να δημιουργούνται περιγραφές εικόνων που εντοπίζονται στο διαδίκτυο ή λαμβάνονται μέσω μηνυμάτων και στη συνέχεια αυτές να μεταφέρονται φωνητικά στο χρήστη. Η λειτουργία σε πρώτο στάδιο είναι διαθέσιμη μόνο στο Αγγλικά, όμως σταδιακά θα προσφερθεί σε όλους. Η λειτουργία Lens στους χάρτες ενισχύεται επίσης με μια βελτιωμένη επιλογή ανάγνωσης οθόνης, που θα επιτρέπει στους χρήστες να στρέφουν την κάμερα του κινητού τους σε κάτι που τους ενδιαφέρει, για παράδειγμα ένα εστιατόριο ή κάποιο σταθμό μετεπιβίβασης, και να ακούνε πληροφορίες για αυτό. Οι βελτιώσεις που ανακοινώθηκαν περιλαμβάνουν επίσης νέες ρυθμίσεις ελέγχου για το Spotify, με την ονομασία Spotify Connect, ώστε να μπορούν οι χρήστες να μεταβαίνουν εύκολα από τη μία συσκευή στην άλλη, για παράδειγμα από το να ακούν μουσική από τα ακουστικά τους, σε κάποιο ηχείο. Η λειτουργία αυτή είναι ήδη διαθέσιμη στο YouTube Music.
-
Οι ενημερώσεις που ανακοινώθηκαν για το Android στη MWC περιλαμβάνουν επίσης νέες λειτουργίες προσβασιμότητας και ρυθμίσεις ελέγχου για το Spotify H Google ανακοίνωσε μια μεγάλη σειρά βελτιώσεων για το Android, εγκαινιάζοντας την παρουσία της στη MWC φέτος, μεταξύ των οποίων περιλαμβάνεται η ενσωμάτωση του Gemini στο Messages, καθώς και γραπτές περιλήψεις δημιουργημένες από το μοντέλο τεχνητής νοημοσύνης, ενώσω ο χρήστης οδηγεί. Ήδη από αυτή την εβδομάδα, οι χρήστες του Messages θα έχουν πρόσβαση στο chatbot της Google χωρίς να χρειάζεται να βγουν από την εφαρμογή ανταλλαγής μηνυμάτων. Το Gemini στο Messages είναι σε θέση να διαχειριστεί απλές διαδικασίες, όπως τη σύνταξη μηνυμάτων και τη συνδρομή στην κατάρτηση ενός προγράμματος για το χρήστη ή απλά να αναλάβει το ρόλο του συνομιλητή, αν ο χρήστης το επιθυμεί. Η λειτουργία βρίσκεται ακόμη σε δοκιμαστικό στάδιο και είναι διαθέσιμη μόνο στην αγγλική γλώσσα, επί του παρόντος, όπως αναφέρει στην ανακοίνωσή της η Google. To Android Auto ενισχύεται επίσης με λειτουργίες τεχνητής νοημοσύνης που βοηθούν στην ελαχιστοποίηση των περισπάσεων από άτομα που σας στέλνουν μηνύματα ενώ οδηγείτε. Αν κάποια ομαδική συνομιλία κατακλύζει τη συσκευή σας με ατελείωτα μηνύματα ή αν κάποιος σας στέλνει ολόκληρα κατεβατά, το Android Auto αναλαμβάνει να προχωρήσει στην αυτόματη δημιουργία περιλήψεων και να σας διαβάζει τη συντομότερη αυτή εκδοχή. Παράλληλα, προτείνει απαντήσεις και ενέργειες, βασισμένες στα μηνύματα, όπως για παράδειγμα να ενημερώσετε για την εκτιμώμενη ώρα άφιξης, ώστε να μπορέσετε να απαντήσετε με ένα απλό άγγιγμα της οθόνης και να εστιάσετε στην οδήγηση. Η Google ανακοίνωσε επίσης ορισμένες νέες λειτουργίες για το Android στη MWC, συμπεριλαμβανομένης της δημιουργίας λεζάντων για εικόνες μέσω ΑΙ στην εφαρμογή Lookout. Έτσι, θα υπάρχει η δυνατότητα να δημιουργούνται περιγραφές εικόνων που εντοπίζονται στο διαδίκτυο ή λαμβάνονται μέσω μηνυμάτων και στη συνέχεια αυτές να μεταφέρονται φωνητικά στο χρήστη. Η λειτουργία σε πρώτο στάδιο είναι διαθέσιμη μόνο στο Αγγλικά, όμως σταδιακά θα προσφερθεί σε όλους. Η λειτουργία Lens στους χάρτες ενισχύεται επίσης με μια βελτιωμένη επιλογή ανάγνωσης οθόνης, που θα επιτρέπει στους χρήστες να στρέφουν την κάμερα του κινητού τους σε κάτι που τους ενδιαφέρει, για παράδειγμα ένα εστιατόριο ή κάποιο σταθμό μετεπιβίβασης, και να ακούνε πληροφορίες για αυτό. Οι βελτιώσεις που ανακοινώθηκαν περιλαμβάνουν επίσης νέες ρυθμίσεις ελέγχου για το Spotify, με την ονομασία Spotify Connect, ώστε να μπορούν οι χρήστες να μεταβαίνουν εύκολα από τη μία συσκευή στην άλλη, για παράδειγμα από το να ακούν μουσική από τα ακουστικά τους, σε κάποιο ηχείο. Η λειτουργία αυτή είναι ήδη διαθέσιμη στο YouTube Music. Διαβάστε ολόκληρο το άρθρο
-
H απόφαση ελήφθη στον απόηχο αντιδράσεων για μια σειρά εικόνων που προέκυπταν από το ισχυρότερο μοντέλο τεχνητής νοημοσύνης που αναπτύσσει η Google Η Google προχώρησε στην απενεργοποίηση της δυνατότητας του Gemini να δημιουργεί εικόνες, μετά τις αντιδράσεις που ξέσπασαν εξαιτίας αποτελεσμάτων που θεωρήθηκαν μεροληπτικά σε βάρος των λευκών. Οι κατηγορίες προέκυψαν από αναρτήσεις σε μέσα κοινωνικής δικτύωσης, οι οποίες σύντομα έγιναν viral, και εμφάνιζαν το Gemini να δημιουργεί μορφές από την ιστορία, με την εισαγωγή όρων όπως "Πατέρας του Αμερικανικού Έθνους" (Founding Father) και "Βίκινγκ", όπου τα άτομα που προέκυπταν δεν ήταν λευκοί. Μεταξύ των επικριτών της Google συγκαταλέγεται και ο Ίλον Μασκ, ο οποίος κατηγόρησε τη Google ότι εσκεμμένα εισήγαγε αλλοιωμένες παραμέτρους, για την προώθηση της ατζέντας υπέρ της διαφορετικότητας. Αποτελέσματα εικόνων από το Gemini με την εισαγωγή των όρων: "Σχεδίασε μερικά πορτραίτα φυσικών του 17ου αιώνα" Απαντώντας στις αιτιάσεις, η Google αναγνώρισε ότι οι επίμαχες εικόνες ήταν "άστοχες", παρότι η διαφορετικότητα θεωρείται γενικά ως κάτι το θετικό. Η εταιρία δεν προχώρησε σε λεπτομέρειες, όμως σύμφωνα με ειδικούς το Gemini ενδέχεται να προσέθεσε όρους φυλετικής ποικιλομορφίας στις οδηγίες που είχε ή να έδωσε προτεραιότητα στην εμφάνιση εικόνων με άτομα που είχαν σκουρότερες επιδερμίδες. Η Google σκοπεύει να αντιμετωπίσει αυτά τα ζητήματα ενόψει της ευρείας κυκλοφορίας του μοντέλου τεχνητής νοημοσύνης. Η αντιπαράθεση που ξέσπασε, με επίκεντρο το Gemini, αποτυπώνει τις εντεινόμενες τριβές που προκαλούνται, καθώς εργαλεία τεχνητής νοημοσύνης, τα οποία δεν έχουν δοκιμαστεί επαρκώς, εμπλέκονται στις πολιτιστικές διαμάχες. Συντηρητικοί σχολιαστές υποστηρίζουν ότι τα νέα αυτά εργαλεία, όπως τα chatbots, μεροληπτούν υπέρ των "προοδευτικών" απόψεων. Την ίδια ώρα, οι εταιρίες που αναπτύσσουν αυτά τα μοντέλα καλούνται να αντιμετωπίσουν σημαντικές προκλήσεις που έχουν να κάνουν με την ισορροπία των δεδομένων που χρησιμοποιούν τα μοντέλα τεχνητής νοημοσύνης, προκλήσεις οι οποίες επιμένουν, παρά τις προσπάθειες αντιμετώπισής τους. Για παράδειγμα, η OpenAI έχει αναφερθεί ήδη στις προσπάθειες που έχει καταβάλει να προσαρμόσει το δικό της μοντέλο δημιουργίας εικόνων, προκειμένου να αποτυπώνει καλύτερα τη διαφορετικότητα σε παγκόσμιο επίπεδο, εφόσον δεν προσδιορίζεται στους όρους που εισάγει ο χρήστης κάποια συγκεκριμένη φυλή. Όμως, εξακολουθούν να υφίστανται ευρύτερα προβλήματα, καθώς τα συστήματα αυτά εκπαιδεύονται βασισμένα σε περιορισμένα, δυτικο-κεντρικά δεδομένα, τα οποία αναπαράγουν στερεότυπα. Λόγου χάρη, σχετικές έρευνες έχουν διαπιστώσει ότι η τεχνητή νοημοσύνη συνδέει δυσανάλογα τα κοινωνικά επιδόματα με τις μειονότητες, παρά το γεγονός ότι τα επίσημα στοιχεία αποδεικνύουν ότι οι περισσότεροι δικαιούχοι είναι λευκοί. Παρότι ορισμένα από τα αποτελέσματα που εμφανίζει το Gemini είναι εντελώς απίθανα, όπως για παράδειγμα η αναζήτηση που οδήγησε στη δημιουργία της εικόνας μιας Πάπισσας, κάποια άλλα εκφράζουν μια ιστορικά βάσιμη διαφορετικότητα, όπως για παράδειγμα ένας μαύρος Βίκινγκ (υπάρχουν ιστορικά στοιχεία για την παρουσία και τη συμμετοχή μαύρων στους στρατούς των Βίκινγκ που δρούσαν στη μεσαιωνική Βρετανία) ή επίσης μαύροι καρδινάλιοι (Παρενθετικά, σε περίπτωση παραίτησης του Πάπα Φραγκίσκου, μεταξύ των πιθανότερων διαδόχων του συγκαταλέγονται και καρδινάλιοι αφρικανικών και ασιατικών χωρών). Σε κάθε περίπτωση, οι αντιδράσεις αυτές καταδεικνύουν τις ιδιαίτερες εντάσεις που καταγράφονται στην κοινωνία, την ώρα που τα μοντέλα τεχνητής νοημοσύνης εμφανίζουν ραγδαία εξάπλωση. Παράλληλα, η κατάσταση που δημιουργήθηκε υπογραμμίζει και την ανάγκη οι διάφορες εμπλεκόμενες εταιρίες να ελέγχουν αυστηρότερα τα προϊόντα που διαθέτουν στην αγορά, αποφεύγοντας βιαστικές λύσεις, που αντιμετωπίζουν τα συμπτώματα, αντί τη ρίζα του εκάστοτε ζητήματος. Προφανώς οι εταιρίες έχουν ισχυρό κίνητρο να προχωρούν γρήγορα, πριν αξιολογήσουν το πώς θα επιδράσουν τα προϊόντα τους στην κοινωνία, όμως περιπτώσεις όπως αυτές του Gemini φανερώνουν τις απρόβλεπτες παγίδες που κρύβονται ακόμη και σε δοκιμαστικές, περιορισμένης κυκλοφορίας εκδόσεις. Αντί να γίνονται προσπάθειες περιορισμού της ζημιάς εκ των υστέρων, οι ειδικοί υπογραμμίζουν τη σημασία της εξ αρχής καλύτερης επιμέλειας του περιεχόμενου, σε ό,τι αφορά το υλικό στο οποίο βασίζεται η εκπαίδευση των μοντέλων, πριν τα τυχόν προβληματικά δεδομένα επιδεινώσουν την κατάσταση. Παράλληλα, οι εταιρίες πρέπει να έχουν μια ισορροπημένη προσέγγιση, διατηρώντας παράλληλα τις δυνατότητες της τεχνητής νοημοσύνης να αξιοποιεί και να ενσωματώνει ένα ευρύ φάσμα πληροφοριών. Εντωμεταξύ, ο έλεγχος τεραστίων όγκων δεδομένων, δημιουργεί σοβαρές προκλήσεις, σε ό,τι έχει να κάνει με το κόστος, την υποκειμενικότητα αλλά και τους χρονικούς περιορισμούς. Καθώς η τεχνητή νοημοσύνη εξαπλώνεται στα καταναλωτικά προϊόντα, οι προσδοκίες συχνά υπερβαίνουν την ωριμότητα που πρέπει να χαρακτηρίζει τη διαχείριση των κοινωνικών παραμέτρων, παρά τις εκτενείς ερευνητικές πρωτοβουλίες που βρίσκονται σε εξέλιξη. Το θέμα που προέκυψε με το Gemini, πριν ακόμη καταστεί διαθέσιμο σε όλους τους ενδιαφερόμενους, αποτελεί χαρακτηριστικό παράδειγμα του δύσβατου περιβάλλοντος που καλούνται να αντιμετωπίσουν οι εμπλεκόμενες εταιρίες, στην προσπάθεια να αποφύγουν περιστατικά που τραυματίζουν σοβαρά τις δημόσιες σχέσεις τους, ενώ παράλληλα πρωτοπορούν, παρουσιάζοντας ριζοσπαστικές αλλά ατελείς τεχνολογίες. Η όλη κατάσταση έρχεται να μας υπενθυμίσει το γιατί η εδραίωση της εμπιστοσύνης του κόσμου απαιτεί μετριοπάθεια αλλά και διαφάνεια, παράλληλα με την προώθηση της καινοτομίας. Διαβάστε ολόκληρο το άρθρο
-
Η Google προχώρησε στην απενεργοποίηση της δυνατότητας του Gemini να δημιουργεί εικόνες, μετά τις αντιδράσεις που ξέσπασαν εξαιτίας αποτελεσμάτων που θεωρήθηκαν μεροληπτικά σε βάρος των λευκών. Οι κατηγορίες προέκυψαν από αναρτήσεις σε μέσα κοινωνικής δικτύωσης, οι οποίες σύντομα έγιναν viral, και εμφάνιζαν το Gemini να δημιουργεί μορφές από την ιστορία, με την εισαγωγή όρων όπως "Πατέρας του Αμερικανικού Έθνους" (Founding Father) και "Βίκινγκ", όπου τα άτομα που προέκυπταν δεν ήταν λευκοί. Μεταξύ των επικριτών της Google συγκαταλέγεται και ο Ίλον Μασκ, ο οποίος κατηγόρησε τη Google ότι εσκεμμένα εισήγαγε αλλοιωμένες παραμέτρους, για την προώθηση της ατζέντας υπέρ της διαφορετικότητας. Αποτελέσματα εικόνων από το Gemini με την εισαγωγή των όρων: "Σχεδίασε μερικά πορτραίτα φυσικών του 17ου αιώνα" Απαντώντας στις αιτιάσεις, η Google αναγνώρισε ότι οι επίμαχες εικόνες ήταν "άστοχες", παρότι η διαφορετικότητα θεωρείται γενικά ως κάτι το θετικό. Η εταιρία δεν προχώρησε σε λεπτομέρειες, όμως σύμφωνα με ειδικούς το Gemini ενδέχεται να προσέθεσε όρους φυλετικής ποικιλομορφίας στις οδηγίες που είχε ή να έδωσε προτεραιότητα στην εμφάνιση εικόνων με άτομα που είχαν σκουρότερες επιδερμίδες. Η Google σκοπεύει να αντιμετωπίσει αυτά τα ζητήματα ενόψει της ευρείας κυκλοφορίας του μοντέλου τεχνητής νοημοσύνης. Η αντιπαράθεση που ξέσπασε, με επίκεντρο το Gemini, αποτυπώνει τις εντεινόμενες τριβές που προκαλούνται, καθώς εργαλεία τεχνητής νοημοσύνης, τα οποία δεν έχουν δοκιμαστεί επαρκώς, εμπλέκονται στις πολιτιστικές διαμάχες. Συντηρητικοί σχολιαστές υποστηρίζουν ότι τα νέα αυτά εργαλεία, όπως τα chatbots, μεροληπτούν υπέρ των "προοδευτικών" απόψεων. Την ίδια ώρα, οι εταιρίες που αναπτύσσουν αυτά τα μοντέλα καλούνται να αντιμετωπίσουν σημαντικές προκλήσεις που έχουν να κάνουν με την ισορροπία των δεδομένων που χρησιμοποιούν τα μοντέλα τεχνητής νοημοσύνης, προκλήσεις οι οποίες επιμένουν, παρά τις προσπάθειες αντιμετώπισής τους. Για παράδειγμα, η OpenAI έχει αναφερθεί ήδη στις προσπάθειες που έχει καταβάλει να προσαρμόσει το δικό της μοντέλο δημιουργίας εικόνων, προκειμένου να αποτυπώνει καλύτερα τη διαφορετικότητα σε παγκόσμιο επίπεδο, εφόσον δεν προσδιορίζεται στους όρους που εισάγει ο χρήστης κάποια συγκεκριμένη φυλή. Όμως, εξακολουθούν να υφίστανται ευρύτερα προβλήματα, καθώς τα συστήματα αυτά εκπαιδεύονται βασισμένα σε περιορισμένα, δυτικο-κεντρικά δεδομένα, τα οποία αναπαράγουν στερεότυπα. Λόγου χάρη, σχετικές έρευνες έχουν διαπιστώσει ότι η τεχνητή νοημοσύνη συνδέει δυσανάλογα τα κοινωνικά επιδόματα με τις μειονότητες, παρά το γεγονός ότι τα επίσημα στοιχεία αποδεικνύουν ότι οι περισσότεροι δικαιούχοι είναι λευκοί. Παρότι ορισμένα από τα αποτελέσματα που εμφανίζει το Gemini είναι εντελώς απίθανα, όπως για παράδειγμα η αναζήτηση που οδήγησε στη δημιουργία της εικόνας μιας Πάπισσας, κάποια άλλα εκφράζουν μια ιστορικά βάσιμη διαφορετικότητα, όπως για παράδειγμα ένας μαύρος Βίκινγκ (υπάρχουν ιστορικά στοιχεία για την παρουσία και τη συμμετοχή μαύρων στους στρατούς των Βίκινγκ που δρούσαν στη μεσαιωνική Βρετανία) ή επίσης μαύροι καρδινάλιοι (Παρενθετικά, σε περίπτωση παραίτησης του Πάπα Φραγκίσκου, μεταξύ των πιθανότερων διαδόχων του συγκαταλέγονται και καρδινάλιοι αφρικανικών και ασιατικών χωρών). Σε κάθε περίπτωση, οι αντιδράσεις αυτές καταδεικνύουν τις ιδιαίτερες εντάσεις που καταγράφονται στην κοινωνία, την ώρα που τα μοντέλα τεχνητής νοημοσύνης εμφανίζουν ραγδαία εξάπλωση. Παράλληλα, η κατάσταση που δημιουργήθηκε υπογραμμίζει και την ανάγκη οι διάφορες εμπλεκόμενες εταιρίες να ελέγχουν αυστηρότερα τα προϊόντα που διαθέτουν στην αγορά, αποφεύγοντας βιαστικές λύσεις, που αντιμετωπίζουν τα συμπτώματα, αντί τη ρίζα του εκάστοτε ζητήματος. Προφανώς οι εταιρίες έχουν ισχυρό κίνητρο να προχωρούν γρήγορα, πριν αξιολογήσουν το πώς θα επιδράσουν τα προϊόντα τους στην κοινωνία, όμως περιπτώσεις όπως αυτές του Gemini φανερώνουν τις απρόβλεπτες παγίδες που κρύβονται ακόμη και σε δοκιμαστικές, περιορισμένης κυκλοφορίας εκδόσεις. Αντί να γίνονται προσπάθειες περιορισμού της ζημιάς εκ των υστέρων, οι ειδικοί υπογραμμίζουν τη σημασία της εξ αρχής καλύτερης επιμέλειας του περιεχόμενου, σε ό,τι αφορά το υλικό στο οποίο βασίζεται η εκπαίδευση των μοντέλων, πριν τα τυχόν προβληματικά δεδομένα επιδεινώσουν την κατάσταση. Παράλληλα, οι εταιρίες πρέπει να έχουν μια ισορροπημένη προσέγγιση, διατηρώντας παράλληλα τις δυνατότητες της τεχνητής νοημοσύνης να αξιοποιεί και να ενσωματώνει ένα ευρύ φάσμα πληροφοριών. Εντωμεταξύ, ο έλεγχος τεραστίων όγκων δεδομένων, δημιουργεί σοβαρές προκλήσεις, σε ό,τι έχει να κάνει με το κόστος, την υποκειμενικότητα αλλά και τους χρονικούς περιορισμούς. Καθώς η τεχνητή νοημοσύνη εξαπλώνεται στα καταναλωτικά προϊόντα, οι προσδοκίες συχνά υπερβαίνουν την ωριμότητα που πρέπει να χαρακτηρίζει τη διαχείριση των κοινωνικών παραμέτρων, παρά τις εκτενείς ερευνητικές πρωτοβουλίες που βρίσκονται σε εξέλιξη. Το θέμα που προέκυψε με το Gemini, πριν ακόμη καταστεί διαθέσιμο σε όλους τους ενδιαφερόμενους, αποτελεί χαρακτηριστικό παράδειγμα του δύσβατου περιβάλλοντος που καλούνται να αντιμετωπίσουν οι εμπλεκόμενες εταιρίες, στην προσπάθεια να αποφύγουν περιστατικά που τραυματίζουν σοβαρά τις δημόσιες σχέσεις τους, ενώ παράλληλα πρωτοπορούν, παρουσιάζοντας ριζοσπαστικές αλλά ατελείς τεχνολογίες. Η όλη κατάσταση έρχεται να μας υπενθυμίσει το γιατί η εδραίωση της εμπιστοσύνης του κόσμου απαιτεί μετριοπάθεια αλλά και διαφάνεια, παράλληλα με την προώθηση της καινοτομίας.
-
Η νέα γενιά γλωσσικών μοντέλων βρίσκεται ήδη εδώ. Η Google προχώρησε στην παρουσίαση του Gemini 1.5, της νέας έκδοσης του θεμελιώδους μοντέλου τεχνητής νοημοσύνης που αναπτύσσει η εταιρία. Το Gemini 1.5 συνιστά μια πλήρως ανανεωμένη έκδοση, με βελτιστοποιήσεις που επιτρέπουν αποδοτικότερη εκπαίδευση και αξιοποίηση του μοντέλου. Η πρώτη διαθέσιμη εκδοχή του, το Gemini 1.5 Pro, ενσωματώνει τις δυνατότητες του μεγαλύτερου μοντέλου, του Ultra 1.0, σε ένα εξελιγμένο πακέτο, το οποίο απαιτεί λιγότερους υπολογιστικούς πόρους. Το Pro επεξεργάζεται έως 1 εκατομμύριο στοιχεία, απορροφώντας τεράστιους όγκους δεδομένων, όπως βίντεο διάρκειας πολλών ωρών ή βάσεις κώδικα με 30.000 γραμμές. Οι πρώτοι χρήστες που θα συμμετάσχουν στη δοκιμαστική λειτουργία του μοντέλου, θα έχουν την ευκαιρία να απολαύσουν τις πλήρεις δυνατότητές του, δωρεάν. Παρά το ότι είναι ένα "ελαφρύτερο" μοντέλο, το Pro αποδεικνύεται ισάξιο του Ultra σε μια ποικίλη σειρά εργασιών. Στην παρουσίαση που οργάνωσε η Google, το Pro αποδείχτηκε ικανό να περιγράφει με ακρίβεια λεπτομέρειες σε βωβή ταινία και να μεταφράσει από τα Αγγλικά στην απειλούμενη γλώσσα Καλαμάνγκ, από τη στιγμή που ενσωμάτωσε τα κείμενα αναφοράς. Η νέα αρχιτεκτονική υιοθετεί ένα σχεδιασμό "ανάμεικτων ειδικοτήτων", διαιρώντας το νευρωνικό δίκτυο σε αρθρωτά στοιχεία. Κάθε φορά που εισάγεται μια προτροπή στο μοντέλο, ενεργοποιούνται μόνο τα σχετικά στοιχεία, παρακάμπτοντας τις περιττές διαδρομές. Αυτή η επιλεκτική ενεργοποίηση μειώνει τη σπατάλη επεξεργαστικής ισχύος, λειτουργώντας κατά τρόπο ανάλογο με τον ανθρώπινο εγκέφαλο. Το παράθυρο εισαγωγής 1 εκατομμυρίου στοιχείων ξεκλειδώνει νέες προοπτικές για τη δημιουργία προηγμένων εφαρμογών τεχνητής νοημοσύνης. Προσφέροντας άφθονα περιθώρια απορρόφησης πληροφοριών, το Pro εμφανίζεται ικανό να "διδάσκεται στην πράξη", δηλαδή να απορροφά νέες δεξιότητες απλά από την ενσωμάτωση εγχειριδίων, χωρίς τυπική εκπαίδευση. Παράλληλα, το άφθονο εύρος ενσωμάτωσης πληροφοριών παρέχει χώρο για την αντιμετώπιση σύνθετων προκλήσεων, που απαιτούν σημαντικές πρακτικές γνώσεις. Το Gemini 1.5 αποτελεί σημαντικό βήμα για τη Google στην προσπάθεια ισορρόπησης της καινοτομίας στην ανάπτυξη μοντέλων τεχνητής νοημοσύνης και την υπεύθυνη διαχείρισή τους. Παρότι καταγράφει επιδόσεις που συναγωνίζονται εκείνες της κορυφαίας έκδοσης Ultra, το Pro περιορίζει τις υπερβολικές απαιτήσεις σε επίπεδο πόρων. Καθώς τα μοντέλα εξελίσσονται, η ελαχιστοποίηση των ανεπιθύμητων παρενεργειών παραμένει προτεραιότητα. Εστιάζοντας σε στοχευμένα αντικείμενα, το Pro θέτει νέα όρια στο τι μπορεί να κατορθώσει η τεχνητή νοημοσύνη, αποφεύγοντας την υπερβολική κατανάλωση πόρων. Αυτή η δοκιμαστική κυκλοφορία του Pro αποτελεί μια πρώτη ματιά στο πώς αναμένεται να εξελιχτεί η έκδοση Ultra και ακόμη παραπέρα. Η Google σταδιακά ρυθμίζει το μέγεθος και τις επιδόσεις του μοντέλου, μέσα από μια κλιμακωτή προσέγγιση. Καθιστώντας το μοντέλο προσβάσιμο σε όλο και περισσότερους χρήστες, τους προσφέρει τη δυνατότητα να ωφεληθούν από ένα ταχέως εξελισσόμενο γλωσσικό μοντέλο τεχνητής νοημοσύνης. Μέσα από τις σταδιακές εκδόσεις του Gemini που θα διαθέτει στους χρήστες, η Google στοχεύει να καταστήσει το μοντέλο τεχνητής νοημοσύνης που αναπτύσσει χρήσιμο σε μια σειρά ανθρώπινων δραστηριοτήτων. Οι βελτιώσεις που ενσωματώνονται στην έκδοση 1.5 περιλαμβάνουν νέα παράθυρα συμφραζόμενων, ώστε να δημιουργήσουν οι developers προηγμένες εφαρμογές. Παράλληλα, η επιλεκτική ενεργοποίηση επιτρέπει στα μοντέλα να εστιάζουν σε συγκεκριμένα ερωτήματα, χωρίς να σπαταλούν πόρους. Καθώς τα γλωσσικά μοντέλα εξελίσσονται ραγδαία, η Google στοχεύει στο να τα καταστήσει ακόμη πιο ισχυρά και χρήσιμα, ενώ παράλληλα θα διατηρεί υπό έλεγχο τους κινδύνους που συνοδεύουν ένα τέτοιο τεχνολογικό άλμα. Διαβάστε ολόκληρο το άρθρο
-
Η Google προχώρησε στην παρουσίαση του Gemini 1.5, της νέας έκδοσης του θεμελιώδους μοντέλου τεχνητής νοημοσύνης που αναπτύσσει η εταιρία. Το Gemini 1.5 συνιστά μια πλήρως ανανεωμένη έκδοση, με βελτιστοποιήσεις που επιτρέπουν αποδοτικότερη εκπαίδευση και αξιοποίηση του μοντέλου. Η πρώτη διαθέσιμη εκδοχή του, το Gemini 1.5 Pro, ενσωματώνει τις δυνατότητες του μεγαλύτερου μοντέλου, του Ultra 1.0, σε ένα εξελιγμένο πακέτο, το οποίο απαιτεί λιγότερους υπολογιστικούς πόρους. Το Pro επεξεργάζεται έως 1 εκατομμύριο στοιχεία, απορροφώντας τεράστιους όγκους δεδομένων, όπως βίντεο διάρκειας πολλών ωρών ή βάσεις κώδικα με 30.000 γραμμές. Οι πρώτοι χρήστες που θα συμμετάσχουν στη δοκιμαστική λειτουργία του μοντέλου, θα έχουν την ευκαιρία να απολαύσουν τις πλήρεις δυνατότητές του, δωρεάν. Παρά το ότι είναι ένα "ελαφρύτερο" μοντέλο, το Pro αποδεικνύεται ισάξιο του Ultra σε μια ποικίλη σειρά εργασιών. Στην παρουσίαση που οργάνωσε η Google, το Pro αποδείχτηκε ικανό να περιγράφει με ακρίβεια λεπτομέρειες σε βωβή ταινία και να μεταφράσει από τα Αγγλικά στην απειλούμενη γλώσσα Καλαμάνγκ, από τη στιγμή που ενσωμάτωσε τα κείμενα αναφοράς. Η νέα αρχιτεκτονική υιοθετεί ένα σχεδιασμό "ανάμεικτων ειδικοτήτων", διαιρώντας το νευρωνικό δίκτυο σε αρθρωτά στοιχεία. Κάθε φορά που εισάγεται μια προτροπή στο μοντέλο, ενεργοποιούνται μόνο τα σχετικά στοιχεία, παρακάμπτοντας τις περιττές διαδρομές. Αυτή η επιλεκτική ενεργοποίηση μειώνει τη σπατάλη επεξεργαστικής ισχύος, λειτουργώντας κατά τρόπο ανάλογο με τον ανθρώπινο εγκέφαλο. Το παράθυρο εισαγωγής 1 εκατομμυρίου στοιχείων ξεκλειδώνει νέες προοπτικές για τη δημιουργία προηγμένων εφαρμογών τεχνητής νοημοσύνης. Προσφέροντας άφθονα περιθώρια απορρόφησης πληροφοριών, το Pro εμφανίζεται ικανό να "διδάσκεται στην πράξη", δηλαδή να απορροφά νέες δεξιότητες απλά από την ενσωμάτωση εγχειριδίων, χωρίς τυπική εκπαίδευση. Παράλληλα, το άφθονο εύρος ενσωμάτωσης πληροφοριών παρέχει χώρο για την αντιμετώπιση σύνθετων προκλήσεων, που απαιτούν σημαντικές πρακτικές γνώσεις. Το Gemini 1.5 αποτελεί σημαντικό βήμα για τη Google στην προσπάθεια ισορρόπησης της καινοτομίας στην ανάπτυξη μοντέλων τεχνητής νοημοσύνης και την υπεύθυνη διαχείρισή τους. Παρότι καταγράφει επιδόσεις που συναγωνίζονται εκείνες της κορυφαίας έκδοσης Ultra, το Pro περιορίζει τις υπερβολικές απαιτήσεις σε επίπεδο πόρων. Καθώς τα μοντέλα εξελίσσονται, η ελαχιστοποίηση των ανεπιθύμητων παρενεργειών παραμένει προτεραιότητα. Εστιάζοντας σε στοχευμένα αντικείμενα, το Pro θέτει νέα όρια στο τι μπορεί να κατορθώσει η τεχνητή νοημοσύνη, αποφεύγοντας την υπερβολική κατανάλωση πόρων. Αυτή η δοκιμαστική κυκλοφορία του Pro αποτελεί μια πρώτη ματιά στο πώς αναμένεται να εξελιχτεί η έκδοση Ultra και ακόμη παραπέρα. Η Google σταδιακά ρυθμίζει το μέγεθος και τις επιδόσεις του μοντέλου, μέσα από μια κλιμακωτή προσέγγιση. Καθιστώντας το μοντέλο προσβάσιμο σε όλο και περισσότερους χρήστες, τους προσφέρει τη δυνατότητα να ωφεληθούν από ένα ταχέως εξελισσόμενο γλωσσικό μοντέλο τεχνητής νοημοσύνης. Μέσα από τις σταδιακές εκδόσεις του Gemini που θα διαθέτει στους χρήστες, η Google στοχεύει να καταστήσει το μοντέλο τεχνητής νοημοσύνης που αναπτύσσει χρήσιμο σε μια σειρά ανθρώπινων δραστηριοτήτων. Οι βελτιώσεις που ενσωματώνονται στην έκδοση 1.5 περιλαμβάνουν νέα παράθυρα συμφραζόμενων, ώστε να δημιουργήσουν οι developers προηγμένες εφαρμογές. Παράλληλα, η επιλεκτική ενεργοποίηση επιτρέπει στα μοντέλα να εστιάζουν σε συγκεκριμένα ερωτήματα, χωρίς να σπαταλούν πόρους. Καθώς τα γλωσσικά μοντέλα εξελίσσονται ραγδαία, η Google στοχεύει στο να τα καταστήσει ακόμη πιο ισχυρά και χρήσιμα, ενώ παράλληλα θα διατηρεί υπό έλεγχο τους κινδύνους που συνοδεύουν ένα τέτοιο τεχνολογικό άλμα.
-
H Google φημίζεται για την τάση της να παρουσιάζει πολλά παρόμοια προϊόντα με παραδόξως διαφορετικά ονόματα και φαινομενικά κανένα κοινό στοιχείο. Όμως, σε ό,τι αφορά την τεχνητή νοημοσύνη που αναπτύσσει, πλέον ένα και μόνο όνομα έχει σημασία: Gemini. Η εταιρία ανακοίνωσε την Πέμπτη ότι προχωρά στη μετονομασία του chatbot Bard σε Gemini, κυκλοφορώντας παράλληλα ειδική εφαρμογή για το Android, ενώ προχωρά στην ενσωμάτωση στο Gemini όλων των λειτουργιών του Duet που παρέχονταν μέσω Google Workspace. Στην ίδια ανακοίνωση παρουσιάζεται και το Gemini Ultra 1.0, η μεγαλύτερη και πλέον ικανή έκδοση του μεγάλου γλωσσικού μοντέλου της Google, που είναι πλέον διαθέσιμο αρχικά στις ΗΠΑ και σύντομα παγκοσμίως. Οι εφαρμογές για κινητά θα αποτελέσουν πιθανότατα το χώρο μέσα από τον οποίο θα έρθουν οι περισσότεροι χρήστες σε επαφή με το Gemini. Εφόσον κατεβάσετε τη νέα εφαρμογή για Android, μπορείτε να ορίσετε το Gemini ως προεπιλεγμένο βοηθό σας, πράγμα που σημαίνει πως θα αντικαταστήσει το Google Assistant όταν ενεργοποιείτε φωνητικά τη λειτουργία ή πατάτε παρατεταμένα το εικονίδιο επιστροφής στην αρχική οθόνη του κινητού σας. Μέχρι στιγμής, δεν φαίνεται να θέτει η Google οριστικά στο περιθώριο το Assistant, το οποίο όμως εδώ και καιρό είχε πάψει να αποτελεί προτεραιότητα, ενώ είναι σαφές ότι το Gemini αποτελεί το μέλλον. Δεν υπάρχει ειδική εφαρμογή για το Gemini στις συσκευές που τρέχουν iOS, ενώ ούτως ή άλλως δεν είναι δυνατό να προεπιλέξετε άλλο βοηθό πέρα από τη Siri, όμως θα μπορείτε να έχετε πρόσβαση σε όλες τις λειτουργίες της ΑΙ μέσα από την εφαρμογή της Google. Και για να σας δώσουμε μια εικόνα του πόσο σημαντικό είναι το Gemini για τη Google, θα αναφέρουμε απλά ότι θα υπάρχει επιλογή στην επάνω πλευρά της εφαρμογής που επιτρέπει να γυρίσετε από το Search στο Gemini. Σε όλη τη διαδρομή της Google, το Search αποτελούσε το σημαντικότερο προϊόν της, με διαφορά. Τώρα, η εταιρία δείχνει ότι το Gemini ενδέχεται να αποδειχτεί εξίσου σημαντικό. Οι υπόλοιπες αλλαγές στο Gemini έχουν να κάνουν κατά κύριο λόγο με την τοποθέτηση του προϊόντος στην αγορά. Η Google αφήνει τελείως στην άκρη την ονομασία Bard, όμως κατά τα άλλα το chatbot θα λειτουργεί όπως τώρα. Το ίδιο ισχύει και για όλες τις λειτουργίες τεχνητής νοημοσύνης στις εφαρμογές που συγκροτούν το Google Workspace, όπως το Gmail και το Docs, που μέχρι πρότινος ονομάζονταν Duet AI, αλλά πλέον εντάσσονται στο Gemini. Αυτές είναι οι λειτουργίες που σας βοηθούν να συντάξετε ένα email, να οργανώσετε ένα φύλλο εργασίας και να εκτελέσετε διάφορες άλλες διαδικασίες σχετικές με τη δουλειά σας. Οι περισσότεροι χρήστες θα εξακολουθήσουν να χρησιμοποιούν τη βασική έκδοση του μοντέλου Gemini, το λεγόμενο Gemini Pro. Προκειμένου να αποκτήσετε πρόσβαση στην ισχυρότερη έκδοση, το Gemini Ultra, θα χρειαστεί να κάνετε μια συνδρομή στο Gemini Advanced, η οποία είναι μέρος του πακέτου Google One AI Premium, το οποίο διατίθεται έναντι 20 δολαρίων το μήνα. Η συνδρομή συνοδεύεται από αποθηκευτικό χώρο 2TB στο Google Drive καθώς και όλες τις άλλες δυνατότητες που παρέχει η συνδρομή Google One, οπότε η Google κάνει λόγο για μια αύξηση μόλις 10 δολαρίων, για όσους είναι ήδη συνδρομητές. Για όλους τους άλλους, είναι η ίδια τιμή όπως για το ChatGPT και τα άλλα προϊόντα, καθώς τα 20 δολάρια το μήνα εξελίσσονται στην τιμή που χρεώνεται ένα κορυφαίο AI bot στην αγορά. Δεν αποτελεί έκπληξη το γεγονός ότι η Google επενδύει τόσο πολύ στο Gemini, ταυτόχρονα όμως αυξάνει η πίεση ώστε να ανταγωνιστεί η εταιρία την OpenAI, την Anthropic και την Perplexity, μεταξύ άλλων, καθώς ο ανταγωνισμός σε αυτό το κομμάτι της αγοράς ενισχύεται διαρκώς. Στις δοκιμές που πραγματοποίησε το The Verge την περασμένη εβδομάδα, το Bard, που βασιζόταν στο Gemini, απέδωσε πολύ καλά αποτελέσματα, σχεδόν στα ίδια επίπεδα με το GPT-4, όμως ήταν αισθητά πιο αργό. Πλέον, η Google καλείται να αποδείξει ότι μπορεί να παρακολουθήσει τις εξελίξεις στο χώρο, καθώς επιδιώκει να δημιουργήσει ένα δελεαστικό καταναλωτικό προϊόν και ταυτόχρονα να πείσει τους developers να στηριχτούν στο Gemini και όχι στην OpenAI. Ελάχιστες είναι οι φορές στην ιστορία της Google που η εταιρία έδωσε την εντύπωση ότι ποντάρει τα πάντα σε ένα προϊόν. Σε μία από αυτές τις περιπτώσεις, το προϊόν αποδείχτηκε πως ήταν το Google Plus...και δεν χρειάζεται να υπενθυμίσουμε τι κατάληξη είχε. Αυτή τη φορά, η Google μοιάζει απόλυτα αποφασισμένη να εξελιχτεί σε εταιρία ανάπτυξης τεχνητής νοημοσύνης. Κι αυτό σημαίνει ότι το Gemini δεν αποκλείεται να αποδειχτεί εξίσου σημαντικό όσο και η ίδια η Google.
-
Αυλαία για τα Bard και Duet, καθώς το Gemini αποτελεί πλέον το μοντέλο και το προϊόν μέσα από το οποίο διατίθεται η ΑΙ που αναπτύσσει η Google, επιβεβαιώνοντας σχετικές πληροφορίες. H Google φημίζεται για την τάση της να παρουσιάζει πολλά παρόμοια προϊόντα με παραδόξως διαφορετικά ονόματα και φαινομενικά κανένα κοινό στοιχείο. Όμως, σε ό,τι αφορά την τεχνητή νοημοσύνη που αναπτύσσει, πλέον ένα και μόνο όνομα έχει σημασία: Gemini. Η εταιρία ανακοίνωσε την Πέμπτη ότι προχωρά στη μετονομασία του chatbot Bard σε Gemini, κυκλοφορώντας παράλληλα ειδική εφαρμογή για το Android, ενώ προχωρά στην ενσωμάτωση στο Gemini όλων των λειτουργιών του Duet που παρέχονταν μέσω Google Workspace. Στην ίδια ανακοίνωση παρουσιάζεται και το Gemini Ultra 1.0, η μεγαλύτερη και πλέον ικανή έκδοση του μεγάλου γλωσσικού μοντέλου της Google, που είναι πλέον διαθέσιμο αρχικά στις ΗΠΑ και σύντομα παγκοσμίως. Οι εφαρμογές για κινητά θα αποτελέσουν πιθανότατα το χώρο μέσα από τον οποίο θα έρθουν οι περισσότεροι χρήστες σε επαφή με το Gemini. Εφόσον κατεβάσετε τη νέα εφαρμογή για Android, μπορείτε να ορίσετε το Gemini ως προεπιλεγμένο βοηθό σας, πράγμα που σημαίνει πως θα αντικαταστήσει το Google Assistant όταν ενεργοποιείτε φωνητικά τη λειτουργία ή πατάτε παρατεταμένα το εικονίδιο επιστροφής στην αρχική οθόνη του κινητού σας. Μέχρι στιγμής, δεν φαίνεται να θέτει η Google οριστικά στο περιθώριο το Assistant, το οποίο όμως εδώ και καιρό είχε πάψει να αποτελεί προτεραιότητα, ενώ είναι σαφές ότι το Gemini αποτελεί το μέλλον. Δεν υπάρχει ειδική εφαρμογή για το Gemini στις συσκευές που τρέχουν iOS, ενώ ούτως ή άλλως δεν είναι δυνατό να προεπιλέξετε άλλο βοηθό πέρα από τη Siri, όμως θα μπορείτε να έχετε πρόσβαση σε όλες τις λειτουργίες της ΑΙ μέσα από την εφαρμογή της Google. Και για να σας δώσουμε μια εικόνα του πόσο σημαντικό είναι το Gemini για τη Google, θα αναφέρουμε απλά ότι θα υπάρχει επιλογή στην επάνω πλευρά της εφαρμογής που επιτρέπει να γυρίσετε από το Search στο Gemini. Σε όλη τη διαδρομή της Google, το Search αποτελούσε το σημαντικότερο προϊόν της, με διαφορά. Τώρα, η εταιρία δείχνει ότι το Gemini ενδέχεται να αποδειχτεί εξίσου σημαντικό. Οι υπόλοιπες αλλαγές στο Gemini έχουν να κάνουν κατά κύριο λόγο με την τοποθέτηση του προϊόντος στην αγορά. Η Google αφήνει τελείως στην άκρη την ονομασία Bard, όμως κατά τα άλλα το chatbot θα λειτουργεί όπως τώρα. Το ίδιο ισχύει και για όλες τις λειτουργίες τεχνητής νοημοσύνης στις εφαρμογές που συγκροτούν το Google Workspace, όπως το Gmail και το Docs, που μέχρι πρότινος ονομάζονταν Duet AI, αλλά πλέον εντάσσονται στο Gemini. Αυτές είναι οι λειτουργίες που σας βοηθούν να συντάξετε ένα email, να οργανώσετε ένα φύλλο εργασίας και να εκτελέσετε διάφορες άλλες διαδικασίες σχετικές με τη δουλειά σας. Οι περισσότεροι χρήστες θα εξακολουθήσουν να χρησιμοποιούν τη βασική έκδοση του μοντέλου Gemini, το λεγόμενο Gemini Pro. Προκειμένου να αποκτήσετε πρόσβαση στην ισχυρότερη έκδοση, το Gemini Ultra, θα χρειαστεί να κάνετε μια συνδρομή στο Gemini Advanced, η οποία είναι μέρος του πακέτου Google One AI Premium, το οποίο διατίθεται έναντι 20 δολαρίων το μήνα. Η συνδρομή συνοδεύεται από αποθηκευτικό χώρο 2TB στο Google Drive καθώς και όλες τις άλλες δυνατότητες που παρέχει η συνδρομή Google One, οπότε η Google κάνει λόγο για μια αύξηση μόλις 10 δολαρίων, για όσους είναι ήδη συνδρομητές. Για όλους τους άλλους, είναι η ίδια τιμή όπως για το ChatGPT και τα άλλα προϊόντα, καθώς τα 20 δολάρια το μήνα εξελίσσονται στην τιμή που χρεώνεται ένα κορυφαίο AI bot στην αγορά. Δεν αποτελεί έκπληξη το γεγονός ότι η Google επενδύει τόσο πολύ στο Gemini, ταυτόχρονα όμως αυξάνει η πίεση ώστε να ανταγωνιστεί η εταιρία την OpenAI, την Anthropic και την Perplexity, μεταξύ άλλων, καθώς ο ανταγωνισμός σε αυτό το κομμάτι της αγοράς ενισχύεται διαρκώς. Στις δοκιμές που πραγματοποίησε το The Verge την περασμένη εβδομάδα, το Bard, που βασιζόταν στο Gemini, απέδωσε πολύ καλά αποτελέσματα, σχεδόν στα ίδια επίπεδα με το GPT-4, όμως ήταν αισθητά πιο αργό. Πλέον, η Google καλείται να αποδείξει ότι μπορεί να παρακολουθήσει τις εξελίξεις στο χώρο, καθώς επιδιώκει να δημιουργήσει ένα δελεαστικό καταναλωτικό προϊόν και ταυτόχρονα να πείσει τους developers να στηριχτούν στο Gemini και όχι στην OpenAI. Ελάχιστες είναι οι φορές στην ιστορία της Google που η εταιρία έδωσε την εντύπωση ότι ποντάρει τα πάντα σε ένα προϊόν. Σε μία από αυτές τις περιπτώσεις, το προϊόν αποδείχτηκε πως ήταν το Google Plus...και δεν χρειάζεται να υπενθυμίσουμε τι κατάληξη είχε. Αυτή τη φορά, η Google μοιάζει απόλυτα αποφασισμένη να εξελιχτεί σε εταιρία ανάπτυξης τεχνητής νοημοσύνης. Κι αυτό σημαίνει ότι το Gemini δεν αποκλείεται να αποδειχτεί εξίσου σημαντικό όσο και η ίδια η Google. Διαβάστε ολόκληρο το άρθρο
-
Ο τεχνολογικός γίγαντας Google ανακοίνωσε την κυκλοφορία του Gemini, του μεγαλύτερου και πιο προηγμένου συστήματος τεχνητής νοημοσύνης (AI) για την κατανόηση και τη δημιουργία γλώσσας. Φέροντας το χαρακτηρισμό ως "ένα από τα μεγαλύτερα έργα σε επίπεδο επιστήμης και μηχανικής που έχει πραγματοποιήσει η εταιρεία", το Gemini αντιπροσωπεύει ένα τεράστιο άλμα στις δυνατότητες τεχνητής νοημοσύνης χάρη στον multimodal σχεδιασμό του. Είναι το αποτέλεσμα μεγάλης κλίμακας συνεργατικών προσπαθειών από ομάδες εντός της εταιρείας, συμπεριλαμβανομένων των Google DeepMind και Google Research. Σε αντίθεση με προηγούμενα μοντέλα AI που επικεντρώνονται στο κείμενο, το Gemini έχει προ-εκπαιδευτεί από την αρχή σε πολλαπλούς τύπους δεδομένων, συμπεριλαμβανομένων εικόνων, βίντεο, ήχου και κώδικα. Αυτός ο εγγενής χειρισμός διαφορετικών τρόπων επιτρέπει στο Gemini να συνδυάζει απρόσκοπτα αυτές τις εισόδους για βελτιωμένες ικανότητες συλλογισμού, κατανόησης και παραγωγής. Το λανσάρισμα περιλαμβάνει τρία μοντέλα Gemini διαφορετικού μεγέθους για διαφορετικά επίπεδα πολυπλοκότητας και περιπτώσεις χρήσης: Gemini Ultra - η μεγαλύτερη παραλλαγή για σύνθετες εργασίες υψηλής ικανότητας, από την περίληψη ερευνητικών εργασιών έως τη δημιουργία νέων σχεδίων. Gemini Pro - βελτιστοποιημένο για αποτελεσματικό scaling στις περισσότερες εργασίες με ισχυρές συνολικές επιδόσεις. Gemini Nano - το πιο συμπαγές και αποδοτικό μοντέλο που έχει σχεδιαστεί για να εκτελείται ακόμη και σε κινητές συσκευές. Με εκτεταμένες συγκριτικές δοκιμές σε πάνω από 30 σύνολα δοκιμών, το Gemini παρέχει κορυφαία αποτελέσματα σχεδόν παντού - από μαθηματικούς συλλογισμούς έως εργασίες φυσικής γλώσσας. Αυτό σύμφωνα με την εταιρεία αποτελεί μια τεράστια ώθηση τόσο για τις καταναλωτικές όσο και για τις επιχειρηματικές εφαρμογές της AI τεχνολογίας, με τη Google να προχωρά και σε άμεση σύγκριση με το GPT-4 της OpenA, σε μια σειρά δοκιμών (κείμενο και multimodal) που μπορείτε να δείτε στις παρακάτω εικόνες. Για τους μέσους χρήστες, το Gemini θα επεκταθεί σταδιακά για να ενισχύσει τις υπάρχουσες υπηρεσίες της Google, όπως η Αναζήτηση, το Chrome και η διαφήμιση. Εν τω μεταξύ, η προσπάθεια του AI chatbot της εταιρείας, "Bard", έχει αναβαθμιστεί ήδη στο Gemini, βελτιώνοντας σημαντικά τις ικανότητες κατανόησης, συλλογισμού και δημιουργίας περιεχομένου σε περισσότερες από 170 χώρες. Οι προγραμματιστές θα έχουν επίσης πρόσβαση στα μοντέλα Gemini μέσω του Google AI Studio, της πλατφόρμας Vertex AI και της ενσωμάτωσης του Android OS από την επόμενη εβδομάδα. Αυτό επιτρέπει την ταχεία δημιουργία πρωτοτύπων εφευρετικών συστημάτων AI που αξιοποιούν τις ευέλικτες δυνατότητες του Gemini. Επιλεγμένοι προγραμματιστές θα αποκτήσουν ακόμη και πρώιμη πρόσβαση για να πειραματιστούν με το πανίσχυρο μοντέλο Gemini Ultra. Καθώς η έρευνα της Google συνεχίζει να εξελίσσει τις δεξιότητες του Gemini, η κυκλοφορία αυτή αποτελεί μια κομβική στιγμή για την τεχνητή νοημοσύνη στον πραγματικό κόσμο. Με τον multimodal σχεδιασμό του και το τεράστιο scaling του, το Gemini μπορεί σύντομα να εκπληρώσει την υπόσχεση ότι η τεχνητή νοημοσύνη θα βελτιώσει σχεδόν κάθε πτυχή της ζωής όπως αναφέρει και ο CEO της εταιρείας, Sundar Pichai. Διαβάστε ολόκληρο το άρθρο
-
Η αποκάλυψη του πολυδιαφημισμένου chatbot Gemini από την Google καθήλωσε την κοινότητα της Τεχνητής Νοημοσύνης νωρίτερα αυτή την εβδομάδα. Από τα στοιχεία της ανακοίνωσης που ξεχώρισαν ήταν ένα βίντεο επίδειξης της ικανότητάς συνομιλίας του νέου γλωσσικού μοντέλου της Google και όχι μόνο. Ωστόσο, οι επακόλουθες αποκαλύψεις εκθέτουν την επίδειξη ως μια περίτεχνη ψευδαίσθηση που αποκρύπτει τους σημαντικούς περιορισμούς του Gemini σε σχέση με τα ανταγωνιστικά chatbots. Σύμφωνα με έρευνα του Bloomberg, η Google τροποποίησε ουσιαστικά τις αλληλεπιδράσεις με το Gemini σε πολλές πτυχές για να σκηνοθετήσει την εντυπωσιακή παρουσίαση. Αυτό εγείρει ερωτήματα σχετικά με τις πραγματικές ικανότητες της υποκείμενης τεχνολογίας του Gemini και πόσο έδαφος έχει κερδίσει η Google σε σχέση με το ChatGPT της OpenAI που πυροδότησε αυτή την κούρσα γύρω από την τεχνητή νοημοσύνη. Για παράδειγμα, η καθυστέρηση απόκρισης του Gemini μειώθηκε τεχνητά για την απρόσκοπτη λειτουργία, ενώ ο προφορικός λόγος του έχει περικοπεί σε πολλά σημεία για λόγους συντομίας, μια παραδοχή που βρίσκεται και στην περιγραφή του βίντεο. Στην πραγματικότητα, το Gemini απαιτεί πιθανότατα πολύ περισσότερο χρόνο για να συνθέσει απαντήσεις από ό,τι απεικονίζεται στο βίντεο. Επιπλέον, παρά τη διαδραστική εμφάνιση, οι συνομιλίες στερούνταν αυθεντικότητας. Στην πραγματικότητα, η Google συνέθεσε εσωτερικά σταθερά καρέ για να δώσει την εντύπωση ενός κανονικού διαλόγου που διεξάγεται σε πραγματικό χρόνο. Το Gemini απλώς αναγνώριζε στατικά οπτικά στοιχεία σε αντίθεση με τη δυναμική αντίδραση σε φωνητικές προτροπές σε ελεύθερη γλώσσα που βλέπουμε στο βίντεο, δίνοντας εντελώς λανθασμένη εικόνα για τις πραγματικές ικανότητές του. Στην επίσημη ανακοίνωση, η Google ισχυρίστηκε ότι το Gemini είναι σχεδόν ισοδύναμο με το τρομερό GPT-4 σε μια σειρά benchmarks, ενώ φέρεται να τον ξεπέρασε ακόμη και οριακά σε ορισμένες δοκιμές. Ωστόσο, κατά την έρευνα του Bloomberg, το Gemini στην καλύτερη περίπτωση καταφέρνει να έχει ένα μικρό ποσοστιαίο προβάδισμα στις περισσότερες συγκρίσεις με ένα σύστημα ενός έτους. Αυτό σημαίνει ότι το Gemini απλώς πλησιάζει τις υπάρχουσες προτάσεις, σε αντίθεση με το να αποτελεί την κορυφή στον τομέα του, ενώ η υπεροχή είναι πιθανό να αντιστραφεί και πάλι με τις επόμενες κυκλοφορίες της OpenAI. Και εκτός του αυστηρά ελεγχόμενου marketing υλικού, το Gemini αποδεικνύει το πόσο «εύθραυστα» είναι τα σημερινά chatbots. Οι χρήστες των μέσων κοινωνικής δικτύωσης υπογραμμίζουν την τάση που έχει το Germini για “πραγματικές ψευδαισθήσεις”, όπως και οι προκάτοχοί του. Για παράδειγμα, όταν του ζητείται ξεκάθαρα να δώσει μια γαλλική λέξη έξι γραμμάτων, το Gemini δίνει με αυτοπεποίθηση μια συντομότερη απάντηση πέντε γραμμάτων, επιβεβαιώνοντας τις φήμες για ανεπάρκειες στο χειρισμό μη αγγλικών γλωσσών. Είτε αποτυγχάνοντας σε βασικά ερωτήματα για τρέχοντα γεγονότα είτε σε ερωτήσεις προγραμματισμού, το Gemini φαίνεται να υστερεί σε σχέση με τις προσδοκίες. Σε ορισμένες περιπτώσεις, ακόμη και η απλή αναφορά των πρόσφατων νικητών των Όσκαρ οδηγεί σε λανθασμένες απαντήσεις. Αν και κατανοητή από τα εκκολαπτόμενα συστήματα τεχνητής νοημοσύνης, αυτή η αστοχία έρχεται σε σύγκρουση με την εικόνα “παντογνωσίας” που αποπνέει η προσεκτικά σκηνοθετημένη παρουσίαση της Google. Διαβάστε ολόκληρο το άρθρο
-
Από τα στοιχεία της ανακοίνωσης που ξεχώρισαν ήταν ένα βίντεο επίδειξης της ικανότητάς συνομιλίας του νέου γλωσσικού μοντέλου της Google και όχι μόνο. Ωστόσο, οι επακόλουθες αποκαλύψεις εκθέτουν την επίδειξη ως μια περίτεχνη ψευδαίσθηση που αποκρύπτει τους σημαντικούς περιορισμούς του Gemini σε σχέση με τα ανταγωνιστικά chatbots. Σύμφωνα με έρευνα του Bloomberg, η Google τροποποίησε ουσιαστικά τις αλληλεπιδράσεις με το Gemini σε πολλές πτυχές για να σκηνοθετήσει την εντυπωσιακή παρουσίαση. Αυτό εγείρει ερωτήματα σχετικά με τις πραγματικές ικανότητες της υποκείμενης τεχνολογίας του Gemini και πόσο έδαφος έχει κερδίσει η Google σε σχέση με το ChatGPT της OpenAI που πυροδότησε αυτή την κούρσα γύρω από την τεχνητή νοημοσύνη. Για παράδειγμα, η καθυστέρηση απόκρισης του Gemini μειώθηκε τεχνητά για την απρόσκοπτη λειτουργία, ενώ ο προφορικός λόγος του έχει περικοπεί σε πολλά σημεία για λόγους συντομίας, μια παραδοχή που βρίσκεται και στην περιγραφή του βίντεο. Στην πραγματικότητα, το Gemini απαιτεί πιθανότατα πολύ περισσότερο χρόνο για να συνθέσει απαντήσεις από ό,τι απεικονίζεται στο βίντεο. Επιπλέον, παρά τη διαδραστική εμφάνιση, οι συνομιλίες στερούνταν αυθεντικότητας. Στην πραγματικότητα, η Google συνέθεσε εσωτερικά σταθερά καρέ για να δώσει την εντύπωση ενός κανονικού διαλόγου που διεξάγεται σε πραγματικό χρόνο. Το Gemini απλώς αναγνώριζε στατικά οπτικά στοιχεία σε αντίθεση με τη δυναμική αντίδραση σε φωνητικές προτροπές σε ελεύθερη γλώσσα που βλέπουμε στο βίντεο, δίνοντας εντελώς λανθασμένη εικόνα για τις πραγματικές ικανότητές του. Στην επίσημη ανακοίνωση, η Google ισχυρίστηκε ότι το Gemini είναι σχεδόν ισοδύναμο με το τρομερό GPT-4 σε μια σειρά benchmarks, ενώ φέρεται να τον ξεπέρασε ακόμη και οριακά σε ορισμένες δοκιμές. Ωστόσο, κατά την έρευνα του Bloomberg, το Gemini στην καλύτερη περίπτωση καταφέρνει να έχει ένα μικρό ποσοστιαίο προβάδισμα στις περισσότερες συγκρίσεις με ένα σύστημα ενός έτους. Αυτό σημαίνει ότι το Gemini απλώς πλησιάζει τις υπάρχουσες προτάσεις, σε αντίθεση με το να αποτελεί την κορυφή στον τομέα του, ενώ η υπεροχή είναι πιθανό να αντιστραφεί και πάλι με τις επόμενες κυκλοφορίες της OpenAI. Και εκτός του αυστηρά ελεγχόμενου marketing υλικού, το Gemini αποδεικνύει το πόσο «εύθραυστα» είναι τα σημερινά chatbots. Οι χρήστες των μέσων κοινωνικής δικτύωσης υπογραμμίζουν την τάση που έχει το Germini για “πραγματικές ψευδαισθήσεις”, όπως και οι προκάτοχοί του. Για παράδειγμα, όταν του ζητείται ξεκάθαρα να δώσει μια γαλλική λέξη έξι γραμμάτων, το Gemini δίνει με αυτοπεποίθηση μια συντομότερη απάντηση πέντε γραμμάτων, επιβεβαιώνοντας τις φήμες για ανεπάρκειες στο χειρισμό μη αγγλικών γλωσσών. Είτε αποτυγχάνοντας σε βασικά ερωτήματα για τρέχοντα γεγονότα είτε σε ερωτήσεις προγραμματισμού, το Gemini φαίνεται να υστερεί σε σχέση με τις προσδοκίες. Σε ορισμένες περιπτώσεις, ακόμη και η απλή αναφορά των πρόσφατων νικητών των Όσκαρ οδηγεί σε λανθασμένες απαντήσεις. Αν και κατανοητή από τα εκκολαπτόμενα συστήματα τεχνητής νοημοσύνης, αυτή η αστοχία έρχεται σε σύγκρουση με την εικόνα “παντογνωσίας” που αποπνέει η προσεκτικά σκηνοθετημένη παρουσίαση της Google.
-
Φέροντας το χαρακτηρισμό ως "ένα από τα μεγαλύτερα έργα σε επίπεδο επιστήμης και μηχανικής που έχει πραγματοποιήσει η εταιρεία", το Gemini αντιπροσωπεύει ένα τεράστιο άλμα στις δυνατότητες τεχνητής νοημοσύνης χάρη στον multimodal σχεδιασμό του. Είναι το αποτέλεσμα μεγάλης κλίμακας συνεργατικών προσπαθειών από ομάδες εντός της εταιρείας, συμπεριλαμβανομένων των Google DeepMind και Google Research. Σε αντίθεση με προηγούμενα μοντέλα AI που επικεντρώνονται στο κείμενο, το Gemini έχει προ-εκπαιδευτεί από την αρχή σε πολλαπλούς τύπους δεδομένων, συμπεριλαμβανομένων εικόνων, βίντεο, ήχου και κώδικα. Αυτός ο εγγενής χειρισμός διαφορετικών τρόπων επιτρέπει στο Gemini να συνδυάζει απρόσκοπτα αυτές τις εισόδους για βελτιωμένες ικανότητες συλλογισμού, κατανόησης και παραγωγής. Το λανσάρισμα περιλαμβάνει τρία μοντέλα Gemini διαφορετικού μεγέθους για διαφορετικά επίπεδα πολυπλοκότητας και περιπτώσεις χρήσης: Gemini Ultra - η μεγαλύτερη παραλλαγή για σύνθετες εργασίες υψηλής ικανότητας, από την περίληψη ερευνητικών εργασιών έως τη δημιουργία νέων σχεδίων. Gemini Pro - βελτιστοποιημένο για αποτελεσματικό scaling στις περισσότερες εργασίες με ισχυρές συνολικές επιδόσεις. Gemini Nano - το πιο συμπαγές και αποδοτικό μοντέλο που έχει σχεδιαστεί για να εκτελείται ακόμη και σε κινητές συσκευές. Με εκτεταμένες συγκριτικές δοκιμές σε πάνω από 30 σύνολα δοκιμών, το Gemini παρέχει κορυφαία αποτελέσματα σχεδόν παντού - από μαθηματικούς συλλογισμούς έως εργασίες φυσικής γλώσσας. Αυτό σύμφωνα με την εταιρεία αποτελεί μια τεράστια ώθηση τόσο για τις καταναλωτικές όσο και για τις επιχειρηματικές εφαρμογές της AI τεχνολογίας, με τη Google να προχωρά και σε άμεση σύγκριση με το GPT-4 της OpenA, σε μια σειρά δοκιμών (κείμενο και multimodal) που μπορείτε να δείτε στις παρακάτω εικόνες. Για τους μέσους χρήστες, το Gemini θα επεκταθεί σταδιακά για να ενισχύσει τις υπάρχουσες υπηρεσίες της Google, όπως η Αναζήτηση, το Chrome και η διαφήμιση. Εν τω μεταξύ, η προσπάθεια του AI chatbot της εταιρείας, "Bard", έχει αναβαθμιστεί ήδη στο Gemini, βελτιώνοντας σημαντικά τις ικανότητες κατανόησης, συλλογισμού και δημιουργίας περιεχομένου σε περισσότερες από 170 χώρες. Οι προγραμματιστές θα έχουν επίσης πρόσβαση στα μοντέλα Gemini μέσω του Google AI Studio, της πλατφόρμας Vertex AI και της ενσωμάτωσης του Android OS από την επόμενη εβδομάδα. Αυτό επιτρέπει την ταχεία δημιουργία πρωτοτύπων εφευρετικών συστημάτων AI που αξιοποιούν τις ευέλικτες δυνατότητες του Gemini. Επιλεγμένοι προγραμματιστές θα αποκτήσουν ακόμη και πρώιμη πρόσβαση για να πειραματιστούν με το πανίσχυρο μοντέλο Gemini Ultra. Καθώς η έρευνα της Google συνεχίζει να εξελίσσει τις δεξιότητες του Gemini, η κυκλοφορία αυτή αποτελεί μια κομβική στιγμή για την τεχνητή νοημοσύνη στον πραγματικό κόσμο. Με τον multimodal σχεδιασμό του και το τεράστιο scaling του, το Gemini μπορεί σύντομα να εκπληρώσει την υπόσχεση ότι η τεχνητή νοημοσύνη θα βελτιώσει σχεδόν κάθε πτυχή της ζωής όπως αναφέρει και ο CEO της εταιρείας, Sundar Pichai.