Η OpenAI παρουσίασε μια αναβαθμισμένη έκδοση της πρωτοποριακής γεννήτριας μετατροπής κειμένου σε εικόνα, DALL-E.

Η νέα έκδοση, με την ονομασία DALL-E 3, ενσωματώνει το ChatGPT, το εξαιρετικά δημοφιλές chatbot τεχνητής νοημοσύνης της OpenAI για συνομιλίες. Στόχος σύμφωνα με την εταιρεία είναι ο εξορθολογισμός και η βελτίωση της διαδικασίας περιγραφής της εικόνας που επιθυμεί ο χρήστης. Με το DALL-E 3, οι premium συνδρομητές των ChatGPT Plus και ChatGPT Enterprise μπορούν απλά να πληκτρολογήσουν ένα αίτημα για μια εικόνα στη διεπαφή συνομιλίας. Στη συνέχεια, το ChatGPT θα έχει μια συνομιλία με τον χρήστη για να κατανοήσει το αίτημα και να δημιουργήσει μια λεπτομερή προτροπή που παρέχει σαφέστερη καθοδήγηση στο DALL-E 3 για όσο το δυνατόν καλύτερο αποτέλεσμα. Αυτό επιτρέπει στους χρήστες να δημιουργούν περίπλοκες, υψηλής πιστότητας εικόνες χωρίς να χρειάζεται να σκέφτονται οι ίδιοι πολύπλοκες περιγραφές για να εισάγουν στο DALL-E 3.

Πέρα από την ενσωμάτωση του ChatGPT, το DALL-E 3 διαθέτει μια σειρά άλλων βελτιώσεων σε σχέση με τους προκατόχους του. Σύμφωνα με την OpenAI, το τελευταίο μοντέλο παράγει εικόνες υψηλότερης οπτικής ποιότητας που αντικατοπτρίζουν με μεγαλύτερη ακρίβεια τις παρεχόμενες περιγραφές των χρηστών. Αυτό ισχύει ιδιαίτερα για τις μακρύτερες, πιο λεπτομερείς προτροπές με τις οποίες οι προηγούμενες εκδόσεις δυσκολεύονταν. Το DALL-E 3 επιδεικνύει επίσης βελτιωμένο χειρισμό δύσκολου περιεχομένου όπως κείμενο και ανθρώπινα χέρια, στοιχεία που ιστορικά αποτελούσαν πρόκληση για τις γεννήτριες εικόνων AI.

Σε μια προσπάθεια να μειωθούν οι επιβλαβείς προκαταλήψεις της AI και να βελτιωθεί η ασφάλεια, το DALL-E 3 ενσωματώνει νέους μηχανισμούς για την απόρριψη μη ασφαλών ή ανήθικων αιτημάτων δημιουργίας εικόνων. Για παράδειγμα, δεν θα απεικονίζει το μοναδικό στυλ ζωντανών καλλιτεχνών χωρίς άδεια ή δεν θα δημιουργεί απεικονίσεις δημόσιων προσώπων. Επιπλέον, οι καλλιτέχνες μπορούν πλέον να μην επιθυμούν να χρησιμοποιηθεί το έργο τους για την εκπαίδευση μελλοντικών εκδόσεων του DALL-E. Η κίνηση αυτή ανταποκρίνεται στις αυξανόμενες ανησυχίες σχετικά με τις παραβιάσεις των πνευματικών δικαιωμάτων και της συγκατάθεσης από τα δημιουργικά μοντέλα τεχνητής νοημοσύνης που εκπαιδεύονται σε δημιουργίες καλλιτεχνών χωρίς έγκριση.

Το λανσάρισμα του DALL-E 3 έρχεται εν μέσω κλιμακούμενου ανταγωνισμού στον καυτό χώρο της δημιουργικής (ή γεννητικής) τεχνητής νοημοσύνης, ιδίως γύρω από τη δημιουργία συνθετικών εικόνων. Ανταγωνιστές όπως οι Midjourney και Stability AI συνεχίζουν να βελτιώνουν τα δικά τους μοντέλα, ωθώντας την OpenAI να παραμείνει στην αιχμή της καινοτομίας. Εκτός από τους συνδρομητές στη premium πρόταση της εταιρείας, η OpenAI σχεδιάζει να παρέχει πρόσβαση στο DALL-E 3 σε ερευνητικούς συνεργάτες και όσους χρησιμοποιούν το API της. Ωστόσο, παραμένει ασαφές αν ή πότε μπορεί να κυκλοφορήσει δημόσια μια δωρεάν έκδοση στο διαδίκτυο, όπως έγινε με το DALL-E 2 και το αρχικό DALL-E.

Με το DALL-E 3 να αξιοποιεί το ChatGPT για την απλοποίηση των περιγραφών καθώς και τη δημιουργία πιο λεπτομερών και αληθοφανών εικόνων, η OpenAI υπογραμμίζει την ηγετική της θέση στη δημιουργία συνθετικών εικόνων. Ωστόσο, οι ανταγωνιστές της παρέχουν εξίσου πολύ καλά αποτελέσματα -ίσως και καλύτερα ανά περιπτώσεις- οπότε οι περαιτέρω βελτιώσεις στην πιστότητα της εικόνας, τη δημιουργική ευελιξία και τις ηθικές εγγυήσεις θα είναι ζωτικής σημασίας για τη διατήρηση του ανταγωνιστικού πλεονεκτήματος στον ταχέως εξελισσόμενο τομέα της δημιουργικής τεχνητής νοημοσύνης. 

  • Like 10