Licenza su dataset si applica anche su dataset ricavato tramite API non documentate?

Ecco alcuni esempi, ognuno con una sfumatura diversa:

  • Sul portale Open Data del Comune di Venezia ci sono dei dataset con stime popolazione aggiornate al giorno precedente, un dataset per ogni “Municipalità” come livello territoriale. Il dataset è rilasciato con licenza cc-by. A me servono gli stessi dati, ma aggregati a livello di isolato, per ogni isolato del Comune. Con un po’ di tentativi ho scoperto come modificare l’url che indirizza al dataset da scaricare e ho scritto uno script che periodicamente scarica i dati di ogni isolato e li aggrega in un unico dataset. Su i dati della popolazione per isolato vale la stessa licenza che sui dati della popolazione per Municipalità?

  • Il Comune di Venezia ha creato un geoportale in cui c’è una mappa per monitorare hotel, locazioni turistiche e altre strutture ricettive. Si possono scaricare tutti i dati (non c’è alcuna licenza -> open by default come mi ha suggerito @aborruso) . Nei dati scaricati manca però la colonna con le coordinate lat/long per la geolocalizzazione. Guardando nel codice ho trovato il link diretto ai dati che alimentano la mappa stessa (non il download link esposto nell’interfaccia) e sto usando i dati scaricati così, identici agli altri ma con anche la geolocalizzazione. Che licenza c’è sulla colonna geolocalizzata, anche questo dataset è open by default?

  • Il Comune di Venezia ha un portale con una mappa del verde pubblico. Anche questo senza licenza -> open by default. Ho scritto al contatto specifico fornito sulla mappa per sapere se era possibile avere gli shapefile che stanno dietro alla mappa sul portale. Mi è stato risposto che “al fine di valutare se poterle fornire quanto richiesto avremmo bisogno di una richiesta ufficiale con dettagliate le motivazioni e il progetto per il quale necessita di tali informazioni.”. Mi chiedo: (1) se questa richiesta sia legale: devo essere io a perder tempo per fare la richiesta ufficiale + loro a dover pagare dipendente con soldi pubblici per valutare richiesta, quando i dati sono di fatto già lì, anche se non esposti con direct link. (2) Se io procedessi anche in questo caso a leggere il codice e trovassi come scaricare i dati via api/guardando il traffico, posso utilizzarli considerandoli sotto open by default, nonostante mi fosse stato chiesto di stilare richiesta ufficiale per averli?

4 Mi Piace

Ciao Alice,

ci siamo confrontati anche con un legale per alcune punti da te riportati.

Trovi le risposte in linea per i tre casi:

Sul portale Open Data del Comune di Venezia ci sono dei dataset con stime popolazione aggiornate al giorno precedente, un dataset per ogni “Municipalità” come livello territoriale. Il dataset è rilasciato con licenza cc-by. A me servono gli stessi dati, ma aggregati a livello di isolato, per ogni isolato del Comune. Con un po’ di tentativi ho scoperto come modificare l’url che indirizza al dataset da scaricare e ho scritto uno script che periodicamente scarica i dati di ogni isolato e li aggrega in un unico dataset. Su i dati della popolazione per isolato vale la stessa licenza che sui dati della popolazione per Municipalità?

I dati non pubblicati - quali sono quelli a cui si può avere accesso studiando il codice e sviluppando, dall’esterno, appositi script - non sono “pubblicati” e, dunque, per certo, non sono coperti da una licenza open. Non si potrebbe nemmeno applicare il principio dell’open data by default non essendo, per l’amministrazione, resi disponibili.

Il Comune di Venezia ha creato un geoportale in cui c’è una mappa per monitorare hotel, locazioni turistiche e altre strutture ricettive . Si possono scaricare tutti i dati (non c’è alcuna licenza -> open by default come mi ha suggerito @aborruso) . Nei dati scaricati manca però la colonna con le coordinate lat/long per la geolocalizzazione. Guardando nel codice ho trovato il link diretto ai dati che alimentano la mappa stessa (non il download link esposto nell’interfaccia) e sto usando i dati scaricati così, identici agli altri ma con anche la geolocalizzazione. Che licenza c’è sulla colonna geolocalizzata, anche questo dataset è open by default?

Ci viene da dire che ricadiamo nel caso precedente per quanto riguarda la sola colonna della georeferenziazione.

Il Comune di Venezia ha un portale con una mappa del verde pubblico. Anche questo senza licenza -> open by default. Ho scritto al contatto specifico fornito sulla mappa per sapere se era possibile avere gli shapefile che stanno dietro alla mappa sul portale. Mi è stato risposto che “al fine di valutare se poterle fornire quanto richiesto avremmo bisogno di una richiesta ufficiale con dettagliate le motivazioni e il progetto per il quale necessita di tali informazioni.”. Mi chiedo: (1) se questa richiesta sia legale: devo essere io a perder tempo per fare la richiesta ufficiale + loro a dover pagare dipendente con soldi pubblici per valutare richiesta, quando i dati sono di fatto già lì, anche se non esposti con direct link. (2) Se io procedessi anche in questo caso a leggere il codice e trovassi come scaricare i dati via api/guardando il traffico, posso utilizzarli considerandoli sotto open by default, nonostante mi fosse stato chiesto di stilare richiesta ufficiale per averli?

Per il punto 2) ricadiamo secondo noi nei casi precedenti. Il fatto di ricavarseli è un qualcosa che fai tu ma l’amministrazione non li rende disponibili. Per il resto ti possiamo dire che le linee guida Agid per la valorizzazione del patrimonio informativo pubblico indicano il formato shape come un formato aperto diffuso per dati geospaziali https://docs.italia.it/italia/daf/lg-patrimonio-pubblico/it/stabile/arch.html#formati-aperti-piu-diffusi-per-i-dati-geografici e puoi sempre utilizzare strumenti a disposizione del cittadino (e.g., accesso civico, difensore civico) per richiedere l’uso di un formato più aperto.

Grazie

Giorgia Lodi (collaboratrice AgID) e Maria Claudia Bodino (Team Digitale)

3 Mi Piace

Ciao @mariaclaudia,
questo thread è molto interessante, e temo che dovremmo disturbare ancora i “legali”.

Parto da questo esempio, un geoportale, per il quale le colonne con le coppie di coordinate non sono “pubblicate”. È la parola pubblicate e la sua definizione su cui vorrei approfondire e confrontarmi.

Se capisco bene è pubblicato tutto ciò che è leggibile. Quindi se si tratta del rendering di una pagina HTML, è leggibile un link a un file CSV in un elenco puntato, e posso applicare l’open by default. Se sono un utente alle prime armi con un CSV e/o con un browser, mi documento, scopro di poterlo aprire con un foglio elettronico e ci lavoro.

Ma è leggibile anche che quel sito si basa su questi servizi http://geoportale.comune.venezia.it/Geocortex/Essentials/REST/sites/IDS/map/mapservices

Per scoprirlo basta usare sempre il browser e cambiare visualizzazione. Se ne so poco di quei tipi di servizi, mi leggo la documentazione e capisco come scaricare i dati.

Perché un file è “pubblicato” solo per il suo apparire in una ordered list, e un’API che fornisce dati e viene renderizzata come “pallini” invece non è “pubblicata”?

Grazie

2 Mi Piace

Ciao @mariaclaudia,
aggiungo due righe a quanto scritto ieri, ripartendo da questa tua frase.

Per almeno uno dei casi di @Alice_Corona sono certo che non ha sviluppato alcuno script: ha letto via browser che i dati della mappa sono esposti via API (i pallini si posizionano nella carta, proprio perché le API espongono le coordinate), ha studiato la documentazione delle API e ha applicato quanto appreso, proprio per accedere alle info pubblicate online (la posizione dei pallini).

Per me questo caso è uguale a un PDF/XLS in un elenco puntato. Perché in entrambi casi si espongono in lettura delle risorse, soltanto in forma diversa (ma per fortuna i dati da anni si espongono anche via API)).
E così come un PDF/XLS in un elenco puntato è pubblico in quanto visibile, così dovrebbe essere per un’API.
E così come diamo per scontata la consapevolezza nel pubblicare un PDF/XLS in un elenco puntato, a maggior forza la dovremmo dare per chi pubblica un’API.

Se fosse possibile, senza fretta, si può avere dal legislatore un elenco puntato con i rifermenti normativi?

Grazie

La risposta sta nell’uso che fai dei dati. Se l’uso è per scopi leciti, non è improprio ne eccessivo, i termini & condizioni del sito non vietano esplicitamente tale utilizzo e non vi sono accorgimenti che rendono esplicito tale divieto (captcha, controllo del referer o del browser, etc…) non ci sono problemi a usarli nel modo che hai descritto, o tramite script, scraper e simili. Se l’uso è per scopi illeciti (per es. spam, o rivendita, se vietata dai T&C o altre norme) allora sarebbe vietato anche prelevarli a mano dal browser.

L’amministrazione può richiederti l’istanza, perché per fornirteli nel formato che hai richiesto, deve fare del lavoro (fosse anche solo chiamare il programmatore del sito e chiedergli di inviarti tali file). Se invece ti aggiusti da sola come hai descritto, puoi procedere.