Μια εταιρεία που ασχολείται με τη σύνθεσης φωνής με τη βοήθεια της τεχνητής νοημοσύνης, δημοσίευσε μια ψεύτικη podcast συνέντευξη μεταξύ του Joe Rogan και του Steve Jobs χρησιμοποιώντας ρεαλιστικές φωνές των δύο ανδρών, ψηφιακά κλωνοποιημένες.

Η συνέντευξη λαμβάνει χώρα κατά τη διάρκεια του "πρώτου επεισοδίου" μιας υποτιθέμενης σειράς podcast που ονομάζεται "Podcast.ai" και δημιουργήθηκε από την Play.ht με έδρα στο Ντουμπάι, η οποία παρέχει υπηρεσίες σύνθεσης φωνής.

Στη συνέντευξη, ακούγεται πρώτα μια αντιγραφή της φωνής του Rogan που δημιουργήθηκε από τεχνολογία κλωνοποίησης φωνής και η οποία έχει επιτρέψει σε μοντέλα τεχνητής νοημοσύνης να αναπαράγουν χαρακτηριστικές φωνές με μεγάλη ακρίβεια, όπως στην περίπτωση του Darth Vader στην τηλεοπτική σειρά Obi-Wan Kenobi της Disney.

Για να επιτευχθεί το αποτέλεσμα, κάποιος πρέπει πρώτα να εκπαιδεύσει το μοντέλο AI σε υπάρχοντα δείγματα της φωνής που προορίζεται να κλωνοποιηθεί. Ο Rogan αποτελεί πρωταρχικό στόχο για την εκπαίδευση φωνής AI από μοντέλα deep learning, επειδή υπάρχει άφθονο υλικό της φωνής του από τα podcasts του. 

Εκεί που το όλο θέμα γίνεται απίστευτο, είναι το γεγονός ότι η Play.ht έβαλε στο παιχνίδι τη φωνή του αποθανόντος CEO της Apple, Steve Jobs. Η φωνή του, αν και ρομποτικά αποσπασματική κατά καιρούς, θυμίζει τις κεντρικές ομιλίες της Apple και τις συνεντεύξεις του στο All Things Digital από τα τέλη της δεκαετίας του 2000. Το Play.ht ισχυρίζεται ότι το κείμενο της συνέντευξης δημιουργήθηκε επίσης από τεχνητή νοημοσύνη, πιθανώς από ένα μεγάλο γλωσσικό μοντέλο (LLM) παρόμοιο με το GPT-3.

«Τα κείμενα παράγονται με λεπτομερώς ρυθμισμένα γλωσσικά μοντέλα», γράφει η Play.ht στον ιστότοπο του Podcast.ai. «Για παράδειγμα, το επεισόδιο του Steve Jobs εκπαιδεύτηκε με βάση τη βιογραφία του και όλες τις ηχογραφήσεις του που μπορέσαμε να βρούμε στο διαδίκτυο, ώστε η τεχνητή νοημοσύνη να τον ζωντανέψει με ακρίβεια».

Αν και η πιστότητα των φωνών στο μεγαλύτερο μέρος της είναι εντυπωσιακή, η 19λεπτη συνέντευξη δεν βγάζει πολύ νόημα. Μετά από λίγο, τα δύο μέρη της φανταστικής συνέντευξης αρχίζουν να αναφέρουν κεντρικά σημεία παλαιών δηλώσεων τους όπου στην περίπτωση του Jobs αφορούν την αισθητική, τα επαναστατικά προϊόντα και τους ανταγωνιστές της Apple. Σε αυτούς περιλαμβάνεται η Google, η Microsoft, η Adobe αλλά και ότι προηγήθηκε πριν την ανακοίνωση του πρώτου Macintosh υπολογιστή.

Για παράδειγμα, κατά τη διάρκεια της συνέντευξης, ο ψεύτικος Jobs υπεισέρχεται σε κριτική της Microsoft που μοιάζει πολύ με ό,τι είπε ο πραγματικός Jobs σε μια διάσημη συνέντευξη του 1995 στο Triumph of the Nerds. Αν και δεν είναι πιστό αντίγραφο της συγκεκριμένης συνέντευξης, είναι κατανοητό ότι η φωνή είναι συνθετική αν κάποιος προχωρήσει στη σύγκριση των δύο. «Αυτό είναι το πρόβλημα που είχα πάντα με τη Microsoft», λέει ο ψεύτικος Jobs. «Από πολλές απόψεις είναι έξυπνοι άνθρωποι και έχουν κάνει καλή δουλειά, αλλά ποτέ δεν είχαν γούστο. Ποτέ δεν είχαν αισθητική».

Το αν είναι νόμιμο να χρησιμοποιούνται φωνητικά μοντέλα του Jobs ή του Rogan με αυτόν τον τρόπο -ιδιαίτερα για την προώθηση ενός εμπορικού προϊόντος- μένει να το δούμε. Και παρά τη φύση του podcast ως διαφημιστικό κόλπο, η ιδέα των podcasts με φανταστικές συζητήσεις μεταξύ διασημοτήτων σίγουρα αποσπά την προσοχή αρκετών.

  • Like 3
  • Thanks 3
  • Confused 2
  • Sad 1