Προς το περιεχόμενο

Η αναγνώριση ομιλίας της Microsoft είναι τώρα τόσο ακριβής όσο των ανθρώπων


voltmod

Προτεινόμενες αναρτήσεις

Από ότι φαίνεται, τα ρομπότ είναι τώρα εξίσου καλά στην αναγνώριση -και μεταγραφή- του προφορικού λόγου όσο και οι άνθρωποι. Τουλάχιστον, αυτό ισχυρίζεται μία ομάδα ερευνητών και μηχανικών της Microsoft του τμήματος Artificial Intelligence και Research της εταιρείας σε έκθεση που δημοσίευσαν.

Οι μηχανικοί της Microsoft αναφέρουν ότι το σύστημα τους έφτασε σε ποσοστό σφάλματος λέξης (WER, Word Error Rate) το 5,9%, ποσοστό που είναι σχεδόν ίσο με εκείνο των ανθρώπινων δυνατοτήτων. “Φτάσαμε στο ανθρώπινο επίπεδο” δήλωσε ο Xuedong Huang, επικεφαλής επιστήμονας στην ομιλία της εταιρείας. “Πρόκειται για ιστορικό επίτευγμα” συμπλήρωσε.

 

Μετά από δεκαετίες δοκιμών, το ορόσημο ήρθε αμέσως μετά το 6,3 WER του προηγούμενου μήνα που ήταν επίσης εντυπωσιακό, αλλά παράλληλα και κάπως μακριά από το “human parity” που ήθελαν να επιτύχουν στο τμήμα τεχνητής νοημοσύνης και έρευνας της Microsoft. Το 5,9 WER έρχεται σε μία περίοδο που η μάχη των ψηφιακών βοηθών και της τεχνητής νοημοσύνης ανάμεσα στα μεγάλα ονόματα του κλάδου έχει αρχίσει να ανάβει και το πρώτο προϊόν που θα επωφεληθεί είναι η Cortana στα Windows ενώ ωφελημένοι θα είναι και φίλου του Xbox. Για να επιτευχθούν τέτοια επίπεδα ακρίβειας, οι ερευνητές της Microsoft επιστράτευσαν νευρωνικά δίκτυα βαθιάς εκμάθησης για να αποθηκεύσουν τεράστιες ποσότητες δεδομένων –που ονομάζονται σύνολα εξάσκησης- που βοήθησαν τα συστήματα να αναγνωρίζουν “ανθρώπινα” μοτίβα. Στην εκπαίδευση των δικτύων χρησιμοποιήθηκαν τόσο ήχοι όσοι και εικόνες για να αξιοποιηθούν τα αποθηκευμένα δεδομένα περισσότερο αποτελεσματικά.

 

Οι ερευνητές παρόλα αυτά θέλουν να γίνει κατανοητό, ότι η ισοτιμία με τον άνθρωπο απέχει από την τελειότητα, και πως στην συγκεκριμένη περίπτωση η τεχνολογία είναι εξίσου καλή όσο οι άνθρωποι, αλλά και μακριά από αυτό που ονομάζουμε άψογη. Η ομάδα πάντως ελπίζει ότι μελλοντικά θα επιτύχει ακόμα υψηλότερα επίπεδα ακρίβειας στην αναγνώριση ομιλίας, εξασφαλίζοντας ότι η τεχνολογίας της λειτουργία καλύτερα σε πραγματικές καταστάσεις όπως σε εστιατόρια με κόσμο, σε πολυσύχναστους δρόμους κ.ά.

 

Link.png Site: TheNextWeb
Link.png Site: Microsoft

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

εχουμε και λεμε

1) εχουνε τεχνητη νοημοσηνη

2) φυτειες καναβης

ελπιζω αυτη την φορα να γινει σωστα και να μηλαμε στην cortana ελληνικα

  • Like 2
Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Οποιοσδήποτε έχει χρησιμοποιήσει Cortana ξέρει πολύ καλά πόσο εξαιρετική είναι η αναγνώριση ομιλίας...

Δεν ξέρω αν το λες ειρωνικά, πάντως εγώ που χρησιμοποίησα την Cortana στα αγγλικά, τα καταλάβαινε όλα. Σταμάτησα όμως, όταν κατάλαβα ότι συνεργάζεται μόνο με το bing και τον edge. Γενικά πάντως και η Siri είναι καλή στην αναγνώριση ομιλίας, που τη δοκίμασα στο mac της κοπέλας μου. Θέλουν δουλειά όμως ακόμα και οι 2 βοηθοί, για να μπορείς να τα κάνεις όλα με φωνητικές εντολές.

Συνδέστε για να σχολιάσετε
Κοινοποίηση σε άλλες σελίδες

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα
  • Δημιουργία νέου...