Richiesta: l'"Archivio storico delle elezioni" in bulk, su dati.gov.it, con un po' di metainfo e "pulizia"

Buonasera,
tutte le volte che si approssimano elezioni, i dati dell’“Archivio storico delle elezioni” del Ministero dell’Interno suscitano un giusto e “intenso” interesse.

Ma ogni volta c’è da creare lo script, perché i dati interessanti sono quelli più di dettaglio (quelli comunali) e questi non sono disponibili in blocco. E ieri infatti ho fatto rapidamente questo script bruttino, con il rischio di essere messo in black list.
Uno degli output sono propro 4 file in bulk con i dati di Senato e Camera, divisi in “scrutini” e “liste”.

La consultazione “paginata” è comoda e serve. Però sarebbe bene avere anche la possibilità di scaricare i “filoni” (file grandi :slight_smile: ) di insieme (suddivisi nei modi che saranno valutati più consoni).
E una volta creati questi file, metterei gli endpoint su datigovit, nella organizzazione “Ministero degli Interni” (al momento 9 dataset).

E sarebbe fantastico provarci (per il primo step), anche solo discuterne per valutarne la fattibilità, per i dati del 4 marzo.

Da subito poi vi chiederei di fare in modo di sollecitare l’inserimento di metadati rispetto agli attuali file CSV di output:

  • dichiarare il separatore;
  • dichiarare l’encoding;
  • dichiarare che ci sono sempre due righe vuote all’inizio (almeno per tutti i file di dettaglio delle politiche del 2013).

Questa delle due righe vuote iniziali, avrà sicuramente una ragione strutturale e/o di processo. Valuterei se fosse possibile rimuoverle.

Sempre nei file attuali, nelle centinaia di file delle politiche del 2013 (questo un esempio) c’è sempre un separatore finale in più a fine riga, e in ogni caso difforme dall’intestaizione (che non l’ha).



Ente;Numero elettori;Numero votanti;Schede bianche;Schede non valide
AGLIE' ;2131;1579;13;91;
AIRASCA ;2920;2354;26;100;
ALA DI STURA ;402;261;5;11;
...

I nomi dei comuni accentati hanno gli apostrofi (AGLIE' e non AGLIÈ), questo ne rende il JOIN con altri dati sempre un po’ scomodo. Inserirei sempre il codice ISTAT relativo.

Scusate la lunghezza, ma senza argomentare sarebbe stato poco utile.

Grazie

6 Mi Piace

Buongiorno Andrea,

abbiamo contattato il Dipartimento per gli Affari interni e territoriali e siamo in attesa di feedback.
Grazie per la segnalazione!

Maria Claudia Bodino

Team DAF

1 Mi Piace

Segnalo che da oggi ci sono i dati in bulk del 2013: camera e senato.

Quattro note:

  • per i CSV encoding e separatore non sono dichiarati, nemmeno nel PDF di riepilogo;
  • è necessario a mio avviso che ci siano i codici ISTAT dei comuni;
  • rinnovo richiesta per i dati in bulk di ogni turno elettorale;
  • rinnovo la richiesta di indicizzazione di questi nuovi dati in bulk anche sul portale nazionale.

Saluti e grazie

2 Mi Piace

Mi associo a questa richiesta, aggiungendo che dovremmo in qualche modo seguire (e possibilmente anche superare) l’esempio del Ministero degli Interni francese.

Durante le recenti elezioni presidenziali, il Ministero ha rilasciato i dati degli spogli in tempo reale e in formato XML, comunicando in precedenza il formato dei dati agli addetti ai lavori con questo documento: http://www.tarn.gouv.fr/IMG/pdf/election_presidentielle_2017_-_guide_pour_le_telechargement_des_resultats_xml-1.pdf

I dati poi, a spoglio terminato, sono confluiti - usando lo stesso standard - nel sito dei dati aperti del ministero (https://www.interieur.gouv.fr/avotreservice/elections/telechargements/PR2017/) e in quello generale (https://www.data.gouv.fr/fr/posts/les-donnees-des-elections/).

L’utilita’ dei dati e la loro diffusione seguendo questa modalita’ di approccio e’ assolutamente efficiente e di successo, e non richiede uno sforzo molto maggiore rispetto alla pubblicazione che gia’ avviene. Potendo realizzare qualcosa di simile in Italia sarebbe motivo di orgoglio internazionale e potenziale esempio per la Open Government Partnership.

1 Mi Piace