Il Garante per la protezione dei dati personali ha pubblicato una serie di indicazioni volte a proteggere i dati personali pubblicati online dai fenomeni di web scraping, quella pratica con cui si estraggono dati dalle pagine web per poi raccoglierli in database o tabelle locali per analizzarli automaticamente o tramite software. Questo processo di raccolta indiscriminata di dati personali su internet è spesso utilizzato da terzi per addestrare modelli di Intelligenza Artificiale Generativa. Il documento del Garante tiene conto dei contributi ricevuti durante un’indagine conoscitiva deliberata nel dicembre scorso. Sebbene l’Autorità non si sia ancora pronunciata definitivamente sulla liceità del web scraping basato sul legittimo interesse, ovvero fatto in virtù di un interesse legato a un diritto tutelato dalla legge, è stata comunque ritenuta necessaria la pubblicazione di alcune indicazioni preliminari per coloro che, in qualità di titolari del trattamento, pubblicano dati personali online.
Tra le misure suggerite nel documento per ostacolare o impedire il web scraping, figurano diverse strategie concrete come la creazione di aree riservate rendendo i dati accessibili solo previa registrazione, sottraendoli così alla pubblica disponibilità, inserire delle clausole anti-scraping nei termini di servizio dei siti web, fare monitoraggio del traffico web per individuare flussi anomali di dati in entrata e in uscita o utilizzare soluzioni tecnologiche fornite dalle stesse società responsabili del web scraping per evitare che la pratica messa in atto da queste superi i confini stabili dalla legge.
Accountability’
Le misure proposte non sono obbligatorie, ma i titolari del trattamento dovranno valutarne l’adozione in base al principio di ‘accountability’, per il quale chi non adotta delle soluzioni di tutela minima è considerato responsabile per i danni che subisce. Questo implica considerare vari fattori come lo stato dell’arte tecnologico e i costi di attuazione, soprattutto per le piccole e medie imprese (Pmi). Il provvedimento del Garante è attualmente in fase di pubblicazione nella Gazzetta Ufficiale. Queste linee guida rappresentano un primo passo, in attesa di ulteriori sviluppi e decisioni definitive da parte dell’Autorità.