Mozilla ha annunciato il rilascio in open source di strumenti per il riconoscimento vocale, chiamati Common Voice. La Fondazione ha preso come base il progetto di ricerca Deep Speech di Baidu, colosso cinese della ricerca, evolvendolo poi con codice proprio.

Mozilla afferma che il motore è stato addestrato ascoltando circa 400.000 registrazioni vocali provenienti da 20.000 persone diverse. Tutti i dati sono disponibili pubblicamente e corrispondono a circa 500 ore di registrazioni.

Un quantitativo simile di dati permette al motore di ottenere una buona accuratezza nel riconoscere il parlato: questo è confermato da Mozilla, infatti, la quale afferma che c'è un tasso di riconoscimento errato delle parole di appena il 6,5%. Questo tasso non è paragonabile a quello umano, ma vi è molto vicino.

La presenza di sufficiente materiale su cui lavorare era uno dei problemi di un altro sistema di riconoscimento vocale, Bixby, che Samsung aveva avuto difficoltà ad addestrare.

La concorrenza presentata dalle varianti chiuse, rappresentate dai sistemi di Amazon, Google, Apple e Microsoft, potrebbe tuttavia presentarsi problematica per i nuovi strumenti di Mozilla. Molte applicazioni sono infatti già state sviluppate per integrarsi con i sistemi a sorgenti chiusi, a loro volta integrati profondamente nei sistemi operativi di riferimento.

La disponibilità di questi strumenti, tuttavia, potrebbe potenzialmente portare allo sviluppo di nuovi prodotti svincolati dalle limitazioni imposte dai colossi dell'IT, favorendo quindi l'innovazione.

È possibile visitare la pagina del progetto a questo indirizzo. È possibile contribuire attivamente al progetto confermando il riconoscimento corretto di piccoli brani o registrandone di nuovi.