Η τεχνολογία VoCo της Adobe θέλει να κάνει παιχνιδάκι την επεξεργασία ηχητικής ομιλίας

Κων/νος Σκιαδάς 07/11/2016 05:05 μμ

Η Adobe μας έχει συνηθίσει σε διάφορες «μαγικές» τεχνολογίες που περιλαμβάνει στα διάφορα προϊόντα της, και όπως φαίνεται έχει ένα ακόμη στα σκαριά με την ονομασία VoCo.

Η τεχνολογία VoCo που παρουσιάστηκε στο πρόσφατο συνέδριο της Adobe MAX 2016, επιτρέπει την ηχογράφηση της φωνής μας, και στη συνέχεια την επεξεργασία της, επιτρέποντας όχι μόνο να αλλάξουμε τη σειρά των λέξεων που έχουμε πει διατηρώντας τον ρεαλισμό σε υψηλά επίπεδα, αλλά και να πληκτρολογήσουμε προτάσεις οι οποίες μπορούν να εκφωνηθούν με τη φωνή μας χωρίς να τις έχουμε πει ποτέ!.

Στο demo που παρουσιάστηκε όπως μπορείτε να δείτε στο βίντεο, η εφαρμογή διαθέτει ένα πλαίσιο κειμένου το οποίο εμφανίζει μετά από την αναγνώριση φωνής που έχει προηγηθεί, το κείμενο που αντιστοιχεί στο ηχογραφημένο ηχητικό μήνυμα. Στη συνέχεια το στέλεχος της Adobe μετακινεί μία λέξη σε άλλη θέση πάνω στην πρόταση, διαγράφει κάποιες άλλες λέξεις και μετά από μια γρήγορη επεξεργασία, το πρόγραμμα εκφωνεί την πρόταση με εντυπωσιακά αποτελέσματα αν και δεν αποφεύγει να δώσει την εντύπωση μιας "συνθετικής" φωνής.

Η τεχνολογία VoCo σύμφωνα με την Adobe λειτουργεί με την εισαγωγή περίπου 20 λεπτών ομιλίας του χρήστη στο πρόγραμμα, δημιουργώντας ανάλογα με τις λέξεις που εκφωνεί, τα αντίστοιχα phonemes. Τα phonemes είναι μικροί ήχοι που διακρίνουν μία λέξη από την άλλη, σε μια συγκεκριμένη γλώσσα (πχ kiss με kill). Χρησιμοποιώντας έτσι τα phonemes, το VoCo προσπαθεί να δημιουργήσει ένα "μοντέλο φωνής" του χρήστη, επιτρέποντας έτσι την εκφώνηση λέξεων τις οποίες δεν έχει εκφωνήσει ποτέ στο πρόγραμμα, αν πρώτα δεν τις εντοπίσει μέσα στο 20λεπτο ηχητικό κλιπ.

Για την ώρα η τεχνολογία VoCo βρίσκετε σε πειραματικό στάδιο ενώ η Adobe δε δίνει περισσότερες τεχνικές λεπτομέρειες για το πότε και αν θα κυκλοφορήσει εμπορικά. Σε περίπτωση που αυτό γίνει, οι χρήσεις της είναι πολλές, συμπεριλαμβανομένου βεβαίως και της δημιουργίας ηχητικών κλιπ με celebrities, πολιτικών κ.α

Site: ArsTechnica

ΣΧΟΛΙΑ (22)

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα

Δημοσίευση ως Επισκέπτης

· Αποσύνδεση

Neg

Δημοσ. 7 Νοεμβρίου 2016

- Share

Εντυπωσιακό! Μπράβο, μακάρι να την διαθέσουν στο κοινό την παραπάνω τεχνολογία.

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

coffeex

Δημοσ. 7 Νοεμβρίου 2016

- Share

αλλά και να πληκτρολογήσουμε προτάσεις οι οποίες μπορούν να εκφωνηθούν με τη φωνή μας χωρίς να τις έχουμε πει ποτέ!.

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

Garuger

Δημοσ. 7 Νοεμβρίου 2016

- Share

Αρα με αυτο θεωρητικα μπορουμε να επαναφερουμε

εν δρασει ολους τους νεκρους ηθοποιους΄ή μπορουμε

να φτιαξουμε Ε-books με φωνες αυτων των ηθοποιων

ή τραγουδιστων . Φαντασου Ε-book απο Frank Sinatra,

Vincent Price κτλ ή ακομα και καινουργια τραγουδια

από Dio , Barry White , Michael Jackson κτλ.

Πραγματικα αμα γινει αυτό διαθεσιμο θα γινει χαμος

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

Kyro

Δημοσ. 7 Νοεμβρίου 2016

- Share

Και τι τηλεφωνικές απάτες έχουν να γίνουν.

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

MosquitoTerminator

Δημοσ. 7 Νοεμβρίου 2016

- Share

Η Adobe ποτε δε θα σταματησει να με εκπλησει (θετικα), παντα καταφερνει να προσθετει νεα futures, που οντως ειναι χρησιμα χωρις να αυξανει τη τιμη των προιοντων της.

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

kosmega

Δημοσ. 7 Νοεμβρίου 2016

- Share

Επίσης:

Text to speech το καινούριο μυθιστόρημα με τη φωνή του αγαπημένου σας αφηγητή. Αν βγάλει σε "add-on" τη φωνή του ο Attenborough θα τον βάλω να μου διαβάζει Wikipedia.

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

Garuger

Δημοσ. 7 Νοεμβρίου 2016

- Share

Επίσης:

Text to speech το καινούριο μυθιστόρημα με τη φωνή του αγαπημένου σας αφηγητή. Αν βγάλει σε "add-on" τη φωνή του ο Attenborough θα τον βάλω να μου διαβάζει Wikipedia.

Το βλεπω το μελλον μαθε Γερμανικα μαζι με τον Χιτλερ και Ρωσικα με τον Λενιν

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

buuren

Δημοσ. 7 Νοεμβρίου 2016

- Share

Πραγματικα εντυπωσιακο αλλα τωρα που πεθαινουν οι θειοι μας που θα βρουμε το crack ρε γμτ?

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

paparovic

Δημοσ. 7 Νοεμβρίου 2016

- Share

ΚΑΤΑΠΛΗΚΤΙΚΟ, το θέλω!

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

Athoz

Δημοσ. 7 Νοεμβρίου 2016

- Share

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

Hapatingo

Δημοσ. 7 Νοεμβρίου 2016

- Share

Προφανώς είναι μόνο για την αγγλική γλώσσα, τουλάχιστον την αρχή. Η adobe πάντα ήταν αρχηγός στον κόσμο software.

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

elvisjedi

Δημοσ. 7 Νοεμβρίου 2016

- Share

εμπνευσμενο απο την δευτερη σεζον του 24 για οσους την εχουν δει....cyprus recording....

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

Mi_ka

Δημοσ. 7 Νοεμβρίου 2016

- Share

και έτσι αρχίζει ο Νεομεσαίωνας όπου σε αντίθεση με τον παλιό Μεσαίωνα που δεν ρέανε οι πληροφορίες, τώρα οι σημαντικές πληροφορίες είναι απλά εντελώς αναξιόπιστες-σκουπίδια...

πως την λέγανε την παλιά ταινία με τον Σβατζενέγκερ με ρήαλ-τάιμ τέτοια παραποίηση των γεγονότων?? "The Running Man" νομίζω του '87

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

Regulus

Δημοσ. 7 Νοεμβρίου 2016

- Share

Έχει να πέσει απάτη και μονταζιέρα με το τσουβάλι (αφού εξελιχθεί η τεχνολογία βέβαια).

Οι δυνατότητες βεβαίως είναι τεράστιες. Tο Photoshop για τον ήχο.

Spooky!!

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

lek88

Δημοσ. 7 Νοεμβρίου 2016

- Share

Εντυπωσιακό!!! Η τεχνολογία προχωράει και αυτό είναι πολύ καλό. Το αν την χρησιμοποιούμε αρνητικά η θετικά είναι δικό μας θέμα.... Ανάλογα τον σκοπό που θα θέλει να χρησιμοποιήσει ο χρήστης το συγκεκριμένο πρόγραμμα. Μπορούν να γίνουν από καμπίνες μέχρι να επαναφέρουν για εμπορικούς σκοπους φωνές μεγάλων ανθρώπων που δεν υπάρχουν πλέον. Παίζει ρόλο και σε τι χέρια θα "πεσει" η τεχνολογία

Σύνδεση

Η τεχνολογία VoCo της Adobe θέλει να κάνει παιχνιδάκι την επεξεργασία ηχητικής ομιλίας

Trending

ΣΧΟΛΙΑ (22)

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Δημιουργία λογαριασμού

Σύνδεση

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

Συνδέστε για να σχολιάσετε

Κοινοποίηση σε άλλες σελίδες

Σύνδεση