Mozilla Italia organizza un Contest per la lingua italiana in Common Voice

Mte90 · 22 Marzo 2021, 4:22pm

Non c’è una sezione random o offtopic quindi scrivo qui.
Come Mozilla Italia da diversi anni seguiamo https://commonvoice.mozilla.org per la nostra lingua italica e ora lanciamo un contest con vari premi in palio da magliette ad adesivi Mozilla e Mozilla Italia per chi contribuirà dal 1 al 30 aprile.

Ci occupiamo anche del rilascio del modello di riconoscimento vocale basato su questo dataset e altri sempre per la lingua italiana.

Speriamo che questo possa aiutare sia le PA che anche in molti contesti, esempio accessibilità.

Per maggiori info chiedete pure o fate riferimento al comunicato stampa: https://discourse.mozilla.org/t/comunicato-stampa-contest-cv-project-01-30-aprile/77356

Elena_S · 23 Marzo 2021, 12:30pm

Ciao, potrebbero andare bene anche i sonori di filmati registrati?

Mte90 · 23 Marzo 2021, 1:05pm

Quello è una tipologia di un dataset ma di per se non è sufficiente.
Per allenare il riconoscimento vocale serve l’accoppiata audio + testo, nel nostro caso inoltre serve che sia un dataset con licenza compatibile ad esempio CC cosa molto rara.
Quindi l’argomento è molto complesso e mi servono piú dati per rispondere al meglio

fabrizio · 23 Marzo 2021, 3:41pm

Già che ci siamo, esiste un motore TTS per Android che sfrutti i risultati di Common Voice?

Mte90 · 23 Marzo 2021, 3:54pm

Common Voice è un dataset, quindi ci serve qualcuno che lo utilizzi per fare un modello.
Ad oggi non abbiamo le mani per fare anche quello (pochi volontari) ma mozilla ha il suo TTS https://github.com/Mozilla/tts quindi non è impossibile da fare.
Sul fattore android, DeepSpeech gira su android quindi forse anche tts ci si può far girare.