Qualcosa non mi torna sui dati iPA

Buon pomeriggio,
oggi volevo fare un JOIN tra una colonna di una mia tabella con un elenco di nomi di comuni italiani e la colonna omologa della tabella amministrazioni.txt che si trova qui.
Non ho potuto farlo in modo diretto, perché nella mia colonna ho il comune di Cefalù, mentre nel file iPA ho Cefalu' (un apice dopo il carattere u e non la u accentata).

Non è scorretto che sia indicato Cefalu' per Cefalù? Se lo è, visto l’importanza del dato, chiedo a chi può di modificare la cosa. Non so però se questo è lo spazio in cui chiedere.

Mi hanno salvato i CAP, che sono presenti in iPA e l’ho usato come campo di JOIN alternativo.

Saluti e grazie

1 Mi Piace

Scusate se ritorno: questa domanda sul dataset iPA è qui off-topic?

Grazie

1 Mi Piace

Ciao Andrea,
ti riporto quanto indicatomi dai colleghi che si occupano direttamente di IPA.
Nel corso del 2014 è stato effettuato un Assessment di sicurezza sul sito web e sui dati dell’Indice delle pubbliche amministrazioni (IPA).
L’Assessment ha riscontrato, tra le altre, una vulnerabilità ad attacchi di tipo SQLInjection e XSS Scripting. Conseguentemente si è provveduto ad effettuare gli interventi per aumentare il livello di sicurezza del sistema, tra i quali il controllo che impedisce l’inserimento di caratteri accentati, che sono stati valutati potenziale oggetto di vulnerabilità, sostituendoli con la vocale senza accento e l’apostrofo.

Ciao,
Giorgia (collaboratrice AgID)

2 Mi Piace

Ciao Giorgia,
era passato troppo tempo e devo dirti non ci speravo più. Grazie per la risposta.

Una domanda e una feature request:

  • chi usa gli accenti nelle PA in Italia su db SQL, come ha risolto? Non si potrebbe prendere spunto da lì?
  • visto che i CAP non sono pubblici, e vista questa faccenda degli accentati, è problematico fare dei JOIN tra questa importante risorsa e altre. Accanto alla colonna comune non si potrebbe inserire il “classico” PRO_COM di ISTAT (il codice ISTAT del comune)?

A chi posso girare quest’ultima richiesta?

Grazie

Ciao Andrea,

chiedo scusa per il ritardo nella risposta ma, come avrai notato, siamo stati recentemente piuttosto presi con diverse release :slight_smile: Giro le tue domande ai colleghi che si occupano di IPA. Sulla questione comuni ti invito anche a controllare il repository su github delle ontologie e dei vocabolari controllati dove abbiamo pubblicato l’ontologia degli indirizzi/luoghi e il vocabolario controllato della classificazione Regioni/Province/Comuni (pubblicata da ISTAT).

Ciao,
Giorgia (collaboratrice AgID)

2 Mi Piace

Ciao Giorgia,

grazie, ne farò tesoro.

Se chi si occupa di IPA aggiungesse proprio il campo Codice Comune formato alfanumerico di questo file, sarebbe una gran cosa. Ne ho approfitatto per aprire una issue.

Ancora grazie

2 Mi Piace

Come cittadino di un Paese che usa caratteri diacritici, sarei molto interessato a capire come i caratteri accentati possano essere oggetto di vulnerabilità in attacchi di tipo SQL Injection.
Segnalo questo interessante articolo di Joel Spolsky del 2/10/2003:

1 Mi Piace

@emmedi penso da un po’ di tempo che discuterne qui non serva, perché chi si occupa dei dati iPA non segue queste spazio e perché credo AgID o Team quando fanno da “passaparola” lo facciano come cortesia personale (grazie).

1 Mi Piace

Beh, io penso che anche chi si occupa dei dati IPA dovrebbe essere caldamente invitato a seguire questo spazio.
(grazie anche da parte mia)

Rriprendo questo thread per un aggiornamento.
Pareva che finalmente il problema della accentate fosse stato risolto, poiché, come mi ha confermato anche il numero verde di Agid, da aprile 2022 su Indice PA sono finalmente utilizzabili le accentate, senza che peraltro sia stata annunciata ufficialmente la novità a tutte le amministrazioni!
Purtroppo però i sistemi che gestiamo devono utilizzare anche la base dati OPENBDAP del MEF, unica che contiene i dati degli enti soppressi, per noi essenziali, ma quest’ultima non accetta le accentate, e quindi sta cominciando a nascere un disallineamento tra le due basi dati per la denominazione IPA che ci sta creando non pochi problemi.
Un esempio: Italriscossioni su IPA compare correttamente come “Italriscossioni Società Italiana di Fiscalità locale Srl” (CF 06092371001) mentre su BDAP è ancora “ITALRISCOSSIONI SOCIETA’ ITALIANA DI FISCALITA’ LOCALE SRL” (06092371001).
La mia segnalazione all’helpdesk di BDAP ha ricevuto questa risposta:

"Gentile Utente,

Le comunichiamo che l’Anagrafe Ente BDAP-RGS rappresenta il risultato di un complesso processo di integrazione dei dati anagrafici provenienti da differenti fonti istituzionali, interne ed esterne alla Ragioneria Generale dello Stato (tra cui l’IPA), ognuna con le proprie specificità in termini di perimetro informativo e di formato dei dati.
Nel suddetto processo di integrazione è prevista una fase di controllo e verifica dei dati finalizzata alla standardizzazione delle informazioni che vengono poi messe a disposizione dei sistemi informatici i cui processi necessitino di un modello di riferimento integrato dell’Anagrafe degli Enti Pubblici.

Tra le regole di standardizzazione applicate e condivise nei protocolli di colloquio tra la RGS e i sistemi fruitori che utilizzano le informazioni dell’Anagrafe Ente RGS vi è l’utilizzo dell’apostrofo al posto degli accenti.

Restiamo comunque a disposizione per fornire eventuali altre informazioni necessarie a supportare al meglio i Vostri processi istituzionali."

Ma se Agid ha finalmente superato il problema, il MEF non potrebbe adeguarsi? :roll_eyes:

@giorgialodi , Agid potrebbe fare qualcosa per avere un allineamento delle denominazioni nelle due basi dati? Tra l’altro, se Indice PA gestisse le amministrazioni soppresse non avremmo bisogno di utilizzare OPENBDAP…

Un saluto!
Emanuele