[LG_Open-Data] 4.1 Requisiti comuni

Sulla base dell’art. 1 del Decreto, le presenti linee guida si applicano ai “documenti contenenti dati pubblici nella disponibilità delle pubbliche amministrazioni, degli organismi di diritto pubblico e delle imprese pubbliche e private”, con esclusione dei casi riportati al par. 1.2 .

Continua a leggere su Docs Italia.

Non mi è chiaro il perimetro di applicazione di queste linee guida. Considerando la figura 4.1, il destinatario è l’intero insieme azzurro (dati disponibili secondo licenza, riutilizzabili da chiunque, disaggregati, nella definizione attuale CAD) oppure l’intersezione verde-rossa (dati contemporaneamente disponibili e accessibili e gratuiti)?
Questa distinzione è secondo me importante per precisare l’orientamento delle linee guida: in pratica ci diciamo che i dati aperti dovrebbero man mano ampliarsi e in teoria corrispondere a lungo termine a tutti i dati disponibili oppure che escludiamo a priori tutto ciò che ad oggi non è accessibile o gratuito?
All’atto pratico forse avrebbe senso evidenziare in figura l’ambito di applicazione con un tratto più marcato.

Quale sarebbe l’apposito provvedimento con cui gli enti motivano le difficoltà nell’apertura dei dati? Esiste un modello e/o fac-simile a cui attenersi? E’ previsto un incentivo ad incoraggiare l’apertura dei dati (limiti temporali entro cui adeguarsi, penalizzazioni, sanzioni, etc.)?

Avrebbe senso aggiungere una raccomandazione che espliciti meglio cosa si intende per dato in formato disaggregato secondo definizione del CAD?
Dalla mia esperienza noto che spesso vi è la tendenza ad aprire solo i dati altamente aggregati, quando invece per un effettivo riutilizzo è necessaria la massima disaggregazione possibile.
All’atto pratico, ove applicabile, si dovrebbero preferire dataset con molte variabili categoriali, così da favorire filtri e categorizzazioni (maggiore informazione e dettaglio).
Per lo stesso motivo, inoltre, la granularità del dato dovrebbe essere sempre esposta al massimo livello di disaggregazione temporale e/o geografico o altro.
Naturalmente sono cosciente che per alcune categorie di dato questo è inibito, dalla privacy o dalla sicurezza, o semplicemente inutile (non esprimerei eventi giornalieri in millisecondi, ecco).
Mi piacerebbe però che si definisse una direzione per orientare tali scelte, potrebbe essere appunto la granularità più fine possibile e l’esposizione di tutti gli attributi disponibili, nei limiti della conformità normativa e del compromesso tecnico.