Non c’è una sezione random o offtopic quindi scrivo qui.
Come Mozilla Italia da diversi anni seguiamo https://commonvoice.mozilla.org per la nostra lingua italica e ora lanciamo un contest con vari premi in palio da magliette ad adesivi Mozilla e Mozilla Italia per chi contribuirà dal 1 al 30 aprile.
Ci occupiamo anche del rilascio del modello di riconoscimento vocale basato su questo dataset e altri sempre per la lingua italiana.
Speriamo che questo possa aiutare sia le PA che anche in molti contesti, esempio accessibilità.
Quello è una tipologia di un dataset ma di per se non è sufficiente.
Per allenare il riconoscimento vocale serve l’accoppiata audio + testo, nel nostro caso inoltre serve che sia un dataset con licenza compatibile ad esempio CC cosa molto rara.
Quindi l’argomento è molto complesso e mi servono piú dati per rispondere al meglio
Common Voice è un dataset, quindi ci serve qualcuno che lo utilizzi per fare un modello.
Ad oggi non abbiamo le mani per fare anche quello (pochi volontari) ma mozilla ha il suo TTS https://github.com/Mozilla/tts quindi non è impossibile da fare.
Sul fattore android, DeepSpeech gira su android quindi forse anche tts ci si può far girare.