Mozilla Italia organizza un Contest per la lingua italiana in Common Voice

Non c’è una sezione random o offtopic quindi scrivo qui.
Come Mozilla Italia da diversi anni seguiamo https://commonvoice.mozilla.org per la nostra lingua italica e ora lanciamo un contest con vari premi in palio da magliette ad adesivi Mozilla e Mozilla Italia per chi contribuirà dal 1 al 30 aprile.

Ci occupiamo anche del rilascio del modello di riconoscimento vocale basato su questo dataset e altri sempre per la lingua italiana.

Speriamo che questo possa aiutare sia le PA che anche in molti contesti, esempio accessibilità.

Per maggiori info chiedete pure o fate riferimento al comunicato stampa: https://discourse.mozilla.org/t/comunicato-stampa-contest-cv-project-01-30-aprile/77356

1 Mi Piace

Ciao, potrebbero andare bene anche i sonori di filmati registrati?

Quello è una tipologia di un dataset ma di per se non è sufficiente.
Per allenare il riconoscimento vocale serve l’accoppiata audio + testo, nel nostro caso inoltre serve che sia un dataset con licenza compatibile ad esempio CC cosa molto rara.
Quindi l’argomento è molto complesso e mi servono piú dati per rispondere al meglio :slight_smile:

Già che ci siamo, esiste un motore TTS per Android che sfrutti i risultati di Common Voice?

Common Voice è un dataset, quindi ci serve qualcuno che lo utilizzi per fare un modello.
Ad oggi non abbiamo le mani per fare anche quello (pochi volontari) ma mozilla ha il suo TTS https://github.com/Mozilla/tts quindi non è impossibile da fare.
Sul fattore android, DeepSpeech gira su android quindi forse anche tts ci si può far girare.