Buonasera,
tutte le volte che si approssimano elezioni, i dati dell’“Archivio storico delle elezioni” del Ministero dell’Interno suscitano un giusto e “intenso” interesse.
Ma ogni volta c’è da creare lo script, perché i dati interessanti sono quelli più di dettaglio (quelli comunali) e questi non sono disponibili in blocco. E ieri infatti ho fatto rapidamente questo script bruttino, con il rischio di essere messo in black list.
Uno degli output sono propro 4 file in bulk con i dati di Senato e Camera, divisi in “scrutini” e “liste”.
La consultazione “paginata” è comoda e serve. Però sarebbe bene avere anche la possibilità di scaricare i “filoni” (file grandi ) di insieme (suddivisi nei modi che saranno valutati più consoni).
E una volta creati questi file, metterei gli endpoint su datigovit, nella organizzazione “Ministero degli Interni” (al momento 9 dataset).
E sarebbe fantastico provarci (per il primo step), anche solo discuterne per valutarne la fattibilità, per i dati del 4 marzo.
Da subito poi vi chiederei di fare in modo di sollecitare l’inserimento di metadati rispetto agli attuali file CSV di output:
- dichiarare il separatore;
- dichiarare l’encoding;
- dichiarare che ci sono sempre due righe vuote all’inizio (almeno per tutti i file di dettaglio delle politiche del 2013).
Questa delle due righe vuote iniziali, avrà sicuramente una ragione strutturale e/o di processo. Valuterei se fosse possibile rimuoverle.
Sempre nei file attuali, nelle centinaia di file delle politiche del 2013 (questo un esempio) c’è sempre un separatore finale in più a fine riga, e in ogni caso difforme dall’intestaizione (che non l’ha).
Ente;Numero elettori;Numero votanti;Schede bianche;Schede non valide
AGLIE' ;2131;1579;13;91;
AIRASCA ;2920;2354;26;100;
ALA DI STURA ;402;261;5;11;
...
I nomi dei comuni accentati hanno gli apostrofi (AGLIE'
e non AGLIÈ
), questo ne rende il JOIN con altri dati sempre un po’ scomodo. Inserirei sempre il codice ISTAT relativo.
Scusate la lunghezza, ma senza argomentare sarebbe stato poco utile.
Grazie