Linked Open Data e Machine Learning

Salve, sarei interessato a capire se qualcuno ha già provato ad utilizzare algoritmi di machine learning applicati ai linked open data.

3 Mi Piace

Ciao @Cristiano! Noi di Synapta abbiamo sperimentato un po’ di cose relativamente a Linked Open Data e Machine Learning ed è una cosa alla quale siamo molto interessati!

Innanzitutto abbiamo reso “Linked” i tutti i dati pubblicati dalle PA grazie per la legge 190/2012 nell’ambito del progetto contrattipubblici.org . Uno sforzo enorme ma che ci ha regalato un grafo con tutte le informazioni relative agli acquisti delle pubbliche amministrazioni italiane.

Lato machine learning abbiamo fatto un progetto di classificazione automatica tamite CPV dei contratti della l.190/2012. Unendo il grafo di contrattipubblici.org con quelli dell’indicePA abbiamo ricavato ulteriori informazioni (es. la tipologia della stazione appaltante).
Le feature principali le abbiamo estratte tramite NLP dagli oggetti dei contratti.

Sempre sfruttando i Linked Data abbiamo costruito dei modelli per cercare similarità tra aziende fornitrici della PA. In quel caso abbiamo usato il grafo generato dai dati della l.190/2012 e l’indicePA collegandolo anche al grafo di Wikidata.

Il collegamento con Wikidata di ha permesso di espandere l’esperimento. Oltre a tecniche di NLP abbiamo infatti aggiunto analisi di distribuzione geografica.

Davide

1 Mi Piace

Ciao @DavideAllavena,

complimenti per il vostro lavoro sembra molto interessante. Mi potresti indicare cosa intendi per CPV dei contratti della I. 190/2012.
Ho visto che avete creatto un grafo tra aziende e pa. Avete usato come relazioni i contratti, oppure dato che i contratti possono avere piu’ aziende avete modellato i contratti come nodi del grafo?

Aggiungendo le info di dettaglio presenti nel portale http://www.indicepa.gov.it avete potuto arricchire i nomi delle aziende con altri dettagli.

  1. Avete avuto casi di entita’ da disambiguare o no?
  2. avete pensato di aggiungere una informazione di partecipata/controllata da tra le aziende?

Che tipo di algoritmi di NLP avete applicato? Named Entity Extraction?

Come avete calcolato la similarita’ tra le aziende? avete usato qualche algoritmo di che scopre la struttura semantica latente nel grafo o un approccio basato su clustering di grafi basato su relation e properties?

a presto,
Fabio

Ciao, noi in LinkedData.Center stiamo usando il machine learning per collegare i nomi delle città alla suddivisione territoriale italiana di Istat e bonificare gli indirizzi postali suggerendo modifiche (in caso di errori, comuni accorpati etc). Stiamo anche sperimentando algoritmi per trovare identità tra differenti business entity.

Yes, I have tried to use machine learning algorithms applied to linked open data from the assistance of https://uaetechnician.ae/computer-data-recovery which has a lot of information.