Ερευνητές της Microsoft κατασκεύασαν ένα λογισμικό μετάφρασης σε πραγματικό χρόνο, χρησιμοποιώντας τη φωνή αλλά και ένα τρισδιάστατο μοντέλο του προσώπου του χρήστη. Το Monolingual TTS παρουσιάστηκε για πρώτη φορά στην έκθεση TechFest 2012 που διοργάνωσε η εταιρεία την προηγούμενη εβδομάδα, αποτελώντας μια τεχνολογία που θα μπορούσε να βοηθήσει σημαντικά την εξέλιξη και το ρεαλισμό των avatar.

 

Το λογισμικό δημιουργεί μια 3D εικόνα του προσώπου μέσω ενός αισθητήρα Kinect και στη συνέχεια ανάλογα το κείμενο που πληκτρολογείται ή τη φωνή που ηχογραφείται, η εικόνα αυτή τροποποιείται με ιδιαίτερα ρεαλιστικές κινήσεις έτσι ώστε να φαίνεται σαν να μιλάει μία από τις υποστηριζόμενες γλώσσες. Υποστηρίζονται προς το παρόν 26 γλώσσες, ενώ το ηχητικό αποτέλεσμα διαφοροποιείται από τον ήχο ενός ρομπότ, καθώς μιμείται τη φωνή του χρήστη. Το πρόγραμμα χρειάζεται περίπου μία ώρα επεξεργασίας για να υοθετήσει μια συγκεκριμένη φωνή και εάν μελλοντικά μπορέσει να ενσωματωθεί σε smartphones, θα αποτελεί ένα ενδιαφέρον βοήθημα στους ταξιδιώτες αλλά και σε όσους ενδιαφέρονται για την εκμάθηση ξένων γλωσσών.

 

 

Link.png Site: pcworld.com