Επιστήμονες στο Πανεπιστήμιο της Καλιφόρνια, Ντέιβις, ανέπτυξαν ένα εγκεφαλικό εμφύτευμα που μετατρέπει τα εγκεφαλικά σήματα σε ομιλία σε πραγματικό χρόνο, σηματοδοτώντας ένα σημαντικό βήμα προς την κατεύθυνση ενός πλήρως ψηφιακού φωνητικού συστήματος.

Η ομάδα με επικεφαλής την Maitreyee Wairagkar, ερευνήτρια νευροπροσθετικής στο UC Davis, δημιούργησε μια συσκευή που επιτρέπει σε ασθενείς με παράλυση να επικοινωνούν με φυσικό τρόπο, διατηρώντας το δικό τους ρυθμό ομιλίας και την ικανότητα να διαμορφώνουν τον τόνο της φωνής τους.

"Ο κύριος στόχος μας είναι η δημιουργία μιας ευέλικτης νευροπρόσθεσης ομιλίας που επιτρέπει σε έναν ασθενή με παράλυση να μιλά όσο το δυνατόν πιο άνετα, διαχειριζόμενος το δικό του ρυθμό, καθώς και να είναι περισσότερο εκφραστικός, προσφέροντάς του τη δυνατότητα του να διαμορφώνει τον τόνο της φωνής του", δήλωσε η Wairagkar.

Σύμφωνα με τον Sergey Stavisky, νευροεπιστήμονα στο UC Davis και έναν από τους κύριους συγγραφείς της μελέτης, προηγούμενα συστήματα είχαν σημαντικούς περιορισμούς. Προγενέστερα εμφυτεύματα μετέφραζαν τα εγκεφαλικά σήματα σε κείμενο, με περιορισμένο λεξιλόγιο περίπου 1.300 λέξεων και σημαντική καθυστέρηση στην απόκριση.

Η νέα συσκευή, αντίθετα, μεταφράζει τα εγκεφαλικά σήματα απευθείας σε ήχους, όχι λέξεις, και το κάνει σχεδόν ακαριαία - με καθυστέρηση μόλις 10 χιλιοστών του δευτερολέπτου.

Στη μελέτη συμμετείχε ένας 46χρονος άνδρας με ALS (αμυοτροφική πλευρική σκλήρυνση), με την κωδική ονομασία T15. Όπως εξήγησε ο David M. Brandman, νευροχειρουργός και ένας από τους συγγραφείς της μελέτης: "Είναι σοβαρά παράλυτος και όταν προσπαθεί να μιλήσει, είναι πολύ δύσκολο να τον καταλάβεις. Τον γνωρίζω εδώ και αρκετά χρόνια, και όταν μιλάει, καταλαβαίνω ίσως το 5% από αυτά που λέει."

Για τη λειτουργία του συστήματος, 256 μικροηλεκτρόδια εμφυτεύτηκαν στην κοιλιακή προκεντρική έλικα του εγκεφάλου του ασθενούς, μια περιοχή υπεύθυνη για τον έλεγχο των μυών του φωνητικού συστήματος. Τα σήματα από τα ηλεκτρόδια στέλνονται σε έναν αλγόριθμο τεχνητής νοημοσύνης που αποκωδικοποιεί τα σήματα και εξάγει χαρακτηριστικά ομιλίας όπως ο τόνος. Tα χαρακτηριστικά αυτά τροφοδοτούν έναν αλγόριθμο σύνθεσης ομιλίας σχεδιασμένο να ακούγεται όπως η φωνή του T15 πριν ασθενήσει.

Στις δοκιμές, το σύστημα πέτυχε 100% κατανόηση όταν οι ακροατές έπρεπε να αντιστοιχίσουν μια ηχογράφηση με μία από έξι προτεινόμενες προτάσεις. Ωστόσο, σε ελεύθερη μεταγραφή, χωρίς προτεινόμενες επιλογές, το ποσοστό σφάλματος ήταν 43,75% - που σημαίνει ότι οι συμμετέχοντες αναγνώρισαν σωστά λίγο περισσότερες από τις μισές λέξεις. Σε κάθε περίπτωση, η επίδοση αυτή αποτελεί σημαντική βελτίωση συγκριτικά με την ομιλία του T15 χωρίς βοήθεια, όπου το ποσοστό σφάλματος ήταν 96,43%.

"Δεν έχουμε φτάσει στο σημείο όπου το σύστημα θα μπορούσε να χρησιμοποιηθεί σε ανοιχτές συζητήσεις. Προσωπικά, το θεωρώ ως ένα πείραμα που δείχνει ότι το σκεπτικό μας είναι βάσιμο", εξήγησε ο Stavisky, υποστηρίζοντας ότι η χρήση περισσότερων ηλεκτροδίων θα μπορούσε να βελτιώσει μελλοντικές εκδοχές του συστήματος.

Η Paradromics, μια νεοφυής εταιρεία που εστιάζει σε διεπαφές εγκεφάλου-υπολογιστή με έδρα το Όστιν του Τέξας, σχεδιάζει ήδη κλινικές δοκιμές ενός συστήματος με 1.600 ηλεκτρόδια και βρίσκεται στο στάδιο εξασφάλισης έγκρισης από τις αρμόδιες αρχές των ΗΠΑ. Ο Brandman θα είναι ο επικεφαλής ερευνητής για αυτές τις δοκιμές, οι οποίες θα πραγματοποιηθούν στο UC Davis.

  • Like 13