Microsoft Migliora la sua Tecnologia di Riconoscimento Vocale

cortana

I ricercatori di Microsoft hanno da poco pubblicato i dettagli riguardanti una nuova tecnologia di riconoscimento vocale che, stando alle parole di Xuedong Huang, ricercatore per l’azienda di Gates, riesce a trascrivere il parlato così come farebbe un umano.

Il sistema commette errori solo nel 5.9% dei casi: Microsoft afferma che questa percentuale di errore è “circa uguale” a quella che commette un trascrittore professionista a cui viene chiesto di lavorare sugli stessi discorsi sottoposti al sistema informatico. La tecnologia usa modelli di linguaggio neurale che raggruppano parole simili, permettendo un’efficace generalizzazione. Microsoft intende utilizzare questa tecnologia per Cortana, l’assistente vocale personale di Windows, e per Xbox One, oltre che come software di trascrizione da parlato a scritto.

Sebbene i risultati siano notevoli, siamo ancora ben lontani dalla perfezione nel campo del riconoscimento vocale. Microsoft deve ancora migliorare la tecnologia affinché possa essere applicata ad un più ampio numero di conversazioni o situazioni di vita reale più complicate in cui il software deve essere in grado di selezionare una voce soltanto fra tante.

Ad esempio, per Cortana la difficoltà sta nell’insegnare ad una intelligenza artificiale come cogliere il significato delle parole e processarle, non solo ascoltarle. Staremo a vedere quali saranno le future applicazioni della tecnologia e quali gli accorgimenti che prenderà Microsoft per superare questi limiti.