Scraping ivaservizi.agenziaentrate.gov.it

masavini · 30 Gennaio 2019, 11:14am

ciao a tutti,
sto scrivendo un semplice script per controllare la presenza di documenti scartati tramite scraping del sito dell’agenzia delle entrate.

l’url per il download dei documenti scartati è fatto così:
https://ivaservizi.agenziaentrate.gov.it/ser/api/monitoraggio/v1/monitoraggio/fatture/?v=1548840144533&idFiscCedente=&idFiscDestinatario=&idFiscEmittente=&idFiscTrasmittente=&idSdi=&perPage=10&start=1&statoFile=9&tipoFattura=TRASMESSA

ottengo correttamente il cookie tramite autenticazione con username, pwd e pin, ma non riesco a capire come ottenere la variabile ‘v’ per il generare l’url di cui sopra…

qualche suggerimento?

simevo · 30 Gennaio 2019, 1:44pm

ha tutta l’aria di un’epoca UNIX in millisecondi

date --date='@1548840144'
mer 30 gen 2019, 10.22.24, CET

la tua richiesta risale a stamattina ?

vbato · 30 Gennaio 2019, 1:54pm

Probabilmente l’unico scopo della variabile v è creare un url univoco per ogni richiesta, in modo da evitare che venga usata una risposta precedente in cache. È un trucco usato tipicamente per le richieste Ajax di tipo GET. Per esmpio jQuery aggiunge una variabile di nome _ con il timestamp.

Romolo_Manfredini · 30 Gennaio 2019, 2:11pm

scusa ma la url se fai scraping la prendi dalla chiamata precedente, che senso ha generarla ?
quindi nella chiamata precedente la V ce l’hai…
Io il mio scraper l’ho implementato così…

masavini · 30 Gennaio 2019, 4:47pm

grazie mille, in effetti il parametro v è un banalissimo timestamp in millisecondi…
risolto!