Scansioni di documenti non ottimizzate e sovraccarico dei sistemi informatici

Un saluto a tutti

Mi è venuta l’idea di scrivere questo post dopo aver letto su diversi siti di news dei problemi dei sistemi che supportano il processo telematico. La lamentela principale è che il sistema non funziona perché i server su cui si appoggia sono inadeguati. Io stesso ho cercato di scaricare qualche documento dal Portale dei Servizi Telematici e mi sono reso conto di quanto siano lenti. A peggiorare la situazione c’è il fatto che questi siano sistemi dedicati al trasferimento dei documenti e nessuno pensa ad ottimizzare i documenti caricati, aggiungendo ulteriore pressione ad un sistema sottodimensionato.

Che cosa intendo per ottimizzare la scansione: molte volte lo scanner è vecchio oppure la carta è sporca o ingiallita o riflette male, nel qual caso la scansione viene con lo sfondo grigiastro, colorato, oppure c’è rumore di fondo. Quello che non si nota ad occhio nudo è che quei pixels sono tutti di sfumature leggermente diverse. Questo è difficilissimo da gestire per gli algoritmi di compressione, alla fine il file viene archiviato salvando lo sfondo del documento pixel per pixel, e oltre allo storage intasa la banda di comunicazione.

Io non sono un grafico, uso programmi come GIMP o Darktable come dilettante, ma anche da dilettante aggiustando alcune scansioni ho ridotto drasticamente la dimensine dei files. Di solito apro il file con GIMP e come prima cosa riduco i livelli di grigio. Con piccoli aggiustamenti vedo lo sfondo che si sbianca notevolmente, il passo successivo è l’aumento del contrasto. Se serve uso Darktable per ridurre il rumore e poi ripristino la nettezza dei dettagli con il filtro Sharpen di GIMP. In questo modo o visto files da 15 mega ridotti a poco più di 2 mega, Anche di scansioni che ad occhio sembrano venute bene spesso si possono dimezzare le dimensioni.

Questi aggiustamenti non possono essere automatizzati, sono diversi da scansione a scansione e il risultato va sempre verificato ad occhio. Cancellieri, avvocati, segretarie e tutte le altre persone coinvolte inclusi i privati cittadini dovrebbero pensare ad aggiustare le scansioni che fanno. Tra documenti firmati a mano e copie di documenti di identità, di scansioni ce ne sono tante. Può sembrare assurdo, ma in realtà programmi tipo GIMP o Photoshop sono accessibili a tutti quanti, non ci vuole tanto per imparare a fare queste modifiche. Il problema è più culturale che tecnico. Di cose del genere non se ne parla.

Ho preso ad esempio i sistemi del Ministero della Giustizia, ma lo stesso ragionamento si applica a tutte le amministrazioni, anzi, i files di dimensioni più grandi li ho visti arrivare dal catasto, e anche lì c’erano grossi margini di miglioramento.

Ma scusate, non sarebbe ora che le PA smettessero di archiviare pdf scansionati, ingombranti e che non permettono la ricerca testuale, e generassero pdf nativi dal text processor (piu’ compatti e che consentono le ricerca nel testo) ? Nel mio ente, l’Istituto Nazionale di Astrofisica, e’ stata una lunga battaglia tra il personale scientifico (che da sempre usa pdf nativi) e quello amministrativo, che sembrava pensare che solo uno scansionato e’ ”originale”.

Il sistema del processo telematico è un sistema di gestione di tutta la documentazione raccolta a supporto dei processi, incluse copie di tutti i documenti usati come prove, spesso documenti forniti da chi sporge querela, ci possono essere anche documenti molto vecchi. Ci sono spesso anche copie dei documenti di identità. Inoltre quel sistema prende in input i documenti che vengono dal portale del Ministero della Giustizia tramite cui gli avvocati possono caricare i documenti raccolti da loro a supporto delle loro tesi.

A parte il sistema che ha ispirato il mio post ci sono anche tanti archivi storici. Se al catasto chiedi di verificare lo stato di un edificio ti possono mandare tutto, incluse copie delle licenze di costruzione e la maggior parte degli edifici con tutte le licenze disponibili sono stati costruiti tra gli anni ‘50 e ´70.