menu di navigazione del network

Qualità dei dati ed integrabilità con altri dataset


(Fabio (Naif) Pietrosanti) #1

Ciao,

per una iniziativa nazionale anticorruzione del Centro Hermes stiamo cercando di integrare i dataset di IndicePA (Agid) con il dataset RPC (ANAC) ma sfortunatamente nel dataset ANAC non c’è un identificativo comune.

Banalmente manca l’identificativo PA o il suo Codice Fiscale, e la PA è identificata solo dalla denominazione, fra l’altro non omogenea rispetto ad IndicePA.

Ovviamente rende l’interesezione delle due basi dati in OpenData un esperienza da incubo, dovendo ricorrere all’uso di algoritmi di similarity matching fra i “nomi delle PA” per riconciliare le due, avendo comunque tanti scarti.

Questo mi porta a pormi 2 domande:

  1. Esiste un metodo di valutazione oggettivo della “qualità” dei dati pubblicati in OpenData e un relativo sistema di reporting-comunicazione per miglioramento?

  2. Quale sarebbe, istituzionalmente, il modo giusto di richiedere da ANAC di pubblicare (sperando/aupicando che ce lo abbiano) un identificativo univoco di PA nell’OpenData degli RPC?

Fabio


(Giorgialodi) #2

Ciao Fabio,

il tuo post mi era sfuggito. Chiedo scusa…
Per il punto 1., le linee guida per la valorizzazione del patrimonio informativo pubblico, hanno una sezione specifica sulla qualità dei dati (http://lg-patrimonio-pubblico.readthedocs.io/it/latest/aspettiorg.html#qualita-dei-dati) e indicano delle metriche di misurazione sulla base degli standard ISO/IEC 25012 e 25024.

Invece per il punto 2. potresti scrivere (magari l’hai già fatto nel mentre) una PEC ad ANAC manifestando il problema e chiedendo se è possibile aggiungere il codice IPA.

Infine, volevo segnalarti che ANAC è un’amministrazione che sta collaborando nell’ambito DAF; quando i lavori saranno terminati, nel DAF ci sarà l’informazione che richiedi.

Ciao,
Giorgia Lodi (collaboratrice AgID)


(Fabio (Naif) Pietrosanti) #3

Ciao Giorgia,

grazie per la risposta e del consiglio, ho mandato una email all’ANAC richiedendo gentilmente l’aggiunta del dato.

In merito invece al DAF, ci sono delle previsioni sulla disponibilità dei dati integrati?

Grazie mille

Fabio