Η Google ανακοίνωσε την κυκλοφορία μιας νέας δυνατότητας στο chatbot τεχνητής νοημοσύνης Gemini, η οποία επιτρέπει τη δημιουργία εικονογραφημένων ιστοριών με μια απλή περιγραφή.

Η λειτουργία, που ονομάζεται Storybook, δημιουργεί ιστορίες 10 σελίδων, καθεμία με μια σύντομη παράγραφο κειμένου που το Gemini μπορεί να διαβάσει φωναχτά και μια αντίστοιχη εικονογράφηση.

Σύμφωνα με τις πληροφορίες, οι χρήστες μπορούν να προσαρμόσουν την ιστορία τους ζητώντας από το Gemini να χρησιμοποιήσει συγκεκριμένα καλλιτεχνικά στυλ, όπως τεχνοτροπίες εμπνευσμένες από claymation, anime, κόμικς και άλλα. Η Google δίνει επίσης τη δυνατότητα μεταφόρτωσης φωτογραφιών ή άλλων εικόνων ως σημεία αναφοράς, όπως για παράδειγμα ένα παιδικό σκίτσο που μπορεί να αποτελέσει τη βάση για μια ολόκληρη ιστορία.

Όπως αναφέρεται, δοκιμή της νέας λειτουργίας ξεκίνησε με την εντολή δημιουργίας μιας ιστορίας για έναν γουλιανό που δυσκολεύεται να κάνει φίλους σε ένα νέο ενυδρείο. Η πλοκή που προέκυψε αφορούσε τους κατοίκους της δεξαμενής που προσπαθούσαν να μετακινήσουν μια γυάλινη μπίλια, κάτι που κρίθηκε αρκετά αδύναμο ως αφήγηση. Ωστόσο, η εμπειρία έμοιαζε τυπική για μια παιδική ιστορία δημιουργημένη από τεχνητή νοημοσύνη — μέχρι που εμφανίστηκε μια εικονογράφηση στην οποία ένα από τα ψάρια είχε…ανθρώπινο χέρι.

Ανάλογες ασυνέπειες εντοπίστηκαν και σε άλλες ιστορίες που παρήχθησαν μέσω της λειτουργίας. Σε μία περίπτωση, μια σελίδα με θέμα σάλτσα σπαγγέτι θύμιζε σκηνή εγκλήματος από καρτούν, ενώ σε άλλη, μια εικόνα μητέρας και γιου που παρακολουθούσαν τηλεόραση απεικόνιζε την οθόνη στην… λάθος πλευρά.

image.png.b177ba708fb4bf42f77ab9c654e4dcc9.png

Πέρα από αυτές τις ιδιαιτερότητες, δεν εντοπίστηκαν άλλες εμφανείς «παραξενιές» του AI σε ιστορίες που δημιουργήθηκαν στη συνέχεια. Ωστόσο, φάνηκε ότι το chatbot δεν συμμεριζόταν πλήρως την καλλιτεχνική αντίληψη του χρήστη όταν του μεταφορτώθηκε ένα σκίτσο καρτούν γάτας, το οποίο η AI απεικόνισε με αρκετές διαφορές.

Το Storybook του Gemini είναι διαθέσιμο παγκοσμίως τόσο σε υπολογιστές όσο και σε κινητές συσκευές, υποστηρίζοντας όλες τις γλώσσες που είναι ήδη διαθέσιμες στην πλατφόρμα.

  • Like 3