Η Adobe μας έχει συνηθίσει σε διάφορες «μαγικές» τεχνολογίες που περιλαμβάνει στα διάφορα προϊόντα της, και όπως φαίνεται έχει ένα ακόμη στα σκαριά με την ονομασία VoCo.

Η τεχνολογία VoCo που παρουσιάστηκε στο πρόσφατο συνέδριο της Adobe MAX 2016, επιτρέπει την ηχογράφηση της φωνής μας, και στη συνέχεια την επεξεργασία της, επιτρέποντας όχι μόνο να αλλάξουμε τη σειρά των λέξεων που έχουμε πει διατηρώντας τον ρεαλισμό σε υψηλά επίπεδα, αλλά και να πληκτρολογήσουμε προτάσεις οι οποίες μπορούν να εκφωνηθούν με τη φωνή μας χωρίς να τις έχουμε πει ποτέ!.

 

Στο demo που παρουσιάστηκε όπως μπορείτε να δείτε στο βίντεο, η εφαρμογή διαθέτει ένα πλαίσιο κειμένου το οποίο εμφανίζει μετά από την αναγνώριση φωνής που έχει προηγηθεί, το κείμενο που αντιστοιχεί στο ηχογραφημένο ηχητικό μήνυμα. Στη συνέχεια το στέλεχος της Adobe μετακινεί μία λέξη σε άλλη θέση πάνω στην πρόταση, διαγράφει κάποιες άλλες λέξεις και μετά από μια γρήγορη επεξεργασία, το πρόγραμμα εκφωνεί την πρόταση με εντυπωσιακά αποτελέσματα αν και δεν αποφεύγει να δώσει την εντύπωση μιας "συνθετικής" φωνής.

 

Η τεχνολογία VoCo σύμφωνα με την Adobe λειτουργεί με την εισαγωγή περίπου 20 λεπτών ομιλίας του χρήστη στο πρόγραμμα, δημιουργώντας ανάλογα με τις λέξεις που εκφωνεί, τα αντίστοιχα phonemes. Τα phonemes είναι μικροί ήχοι που διακρίνουν μία λέξη από την άλλη, σε μια συγκεκριμένη γλώσσα (πχ kiss με kill). Χρησιμοποιώντας έτσι τα phonemes, το VoCo προσπαθεί να δημιουργήσει ένα "μοντέλο φωνής" του χρήστη, επιτρέποντας έτσι την εκφώνηση λέξεων τις οποίες δεν έχει εκφωνήσει ποτέ στο πρόγραμμα, αν πρώτα δεν τις εντοπίσει μέσα στο 20λεπτο ηχητικό κλιπ.

 


 


Για την ώρα η τεχνολογία VoCo βρίσκετε σε πειραματικό στάδιο ενώ η Adobe δε δίνει περισσότερες τεχνικές λεπτομέρειες για το πότε και αν θα κυκλοφορήσει εμπορικά. Σε περίπτωση που αυτό γίνει, οι χρήσεις της είναι πολλές, συμπεριλαμβανομένου βεβαίως και της δημιουργίας ηχητικών κλιπ με celebrities, πολιτικών κ.α

 

Link.png Site: ArsTechnica