Gli algoritmi di intelligenza artificiale, a cominciare da quelli che danno vita, ai sempre più popolari servizi di intelligenza artificiale generativa sono golosi – e, anzi, verrebbe da dire voraci – di contenuti e dati, inclusi quelli personali. Ammesso che mai divengano intelligenti, infatti, certamente nascono sciocchi e, acquisiscono abilità diverse – quando e nella misura in cui le acquisiscono per davvero – grazie ai dati sui quali vengono addestrati.
Nessun dubbio, pertanto, che contenuti e dati, inclusi quelli personali, possano essere considerati senza tema di smentita la materia prima irrinunciabile di uno dei settori dell’industria digitale al momento più fiorente. Impossibile, quindi, non chiedersi quali siano le dinamiche di estrazione e approvvigionamento di queste materie prime e interrogarsi sulla loro legittimità.
Le fonti di approvvigionamento principale sono essenzialmente di due tipi: il mare di bit di Internet e i laghi privati di editori e affini che sempre più di frequente concludono con le fabbriche di algoritmi accordi di licenza di pesca. Tutto straordinariamente semplice e, almeno in alcuni passaggi, invisibile o, almeno, trasparente agli occhi dei più.
Ma è tutto regolare? I dubbi come sa chi segue le cose dell’intelligenza artificiale sono tanti, irrisolti e importanti. Il primo: pescare a strascico online ogni genere di contenuto e dato, inclusi quelli personali, senza chiedere permessi e autorizzazioni è legittimo? La risposta di sintesi, l’unica compatibile con questa rubrica, è: non sempre.
Leggi anche: Mentre Altman presenta GPT-4o nuove azioni legali contro OpenAI e Microsoft
La disciplina sul diritto d’autore, quella sulla concorrenza sleale e quella sulla protezione dei dati personali contengono indiscutibilmente una serie di vincoli dei quali i pescatori delle grandi fabbriche di intelligenza artificiale dovrebbero tener conto. Ma questo è, probabilmente, il profilo del quale si è discusso di più e si continua a discutere.
Anche perché in giro per il mondo si moltiplicano le cause di detentori di diritti d’autore che contestano a OpenAI, Microsoft e loro concorrenti di cannibalizzare senza alcun diritto il loro patrimonio autorale. Tanto per citarne una tra centinaia: il New York Times ha trascinato in giudizio OpenAI e Microsoft esattamente per questa ragione. E la questione è, ormai da un po’, anche all’attenzione delle autorità di protezione dei dati personali di mezzo mondo che non sono convinte della circostanza che, quando nella rete ci finiscono dati personali e gli interessati non ne siano neppure informati, la pesca possa considerarsi lecita.
Ci sono, tuttavia, almeno un paio di altre questioni, meno discusse sin qui ma non meno rilevanti. Una concerne il diritto degli editori di giornali di licenziare alle fabbriche degli algoritmi i loro contenuti perché lo usino per addestrare i propri algoritmi. È una questione che ha due facce. La prima riguarda il diritto d’autore: si può dare per scontato che un editore di giornale disponga di tutti i diritti sui contenuti pubblicati anche per autorizzare un terzo a utilizzarli per una finalità completamente diversa rispetto a quella per la quale ha pagato gli autori dei contenuti in questione, quando li ha pagati?
Problema complicatissimo per tante ragioni diverse a cominciare dal fatto che i contenuti che finiscono sulle pagine dei giornali hanno origini diversissime e se già è lecito dubitare che un editore possa aver acquistato da un giornalista anche il diritto a licenziare l’articolo che questi ha scritto a OpenAI e soci perché lo utilizzino per sviluppare dei concorrenti artificiali del giornalista medesimo lo è ancora di più in relazione, ad esempio, agli annunci legali pure pubblicati sui giornali, alle lettere dei lettori, agli editoriali di personaggi noti e a tutta quella variegata congerie di contenuti in relazione ai quali, normalmente, l’editore non acquista diritti.
La seconda faccia riguarda la privacy: che diritto hanno gli editori sui dati personali presenti nei contenuti che licenziano alle fabbriche di intelligenze artificiali? La risposta, in questo caso è semplice: nessuno o, almeno, nessuno diverso dalla facoltà di pubblicare quei dati nei limiti e per il tempo in cui può considerarsi sussistente un interesse pubblico a conoscerli.
Ma allora come fanno gli editori a licenziare, inevitabilmente, anche i dati personali in questione? È necessario approfondire. Un’altra questione riguarda la posizione di chi, da titolare del trattamento, pubblica online dati personali. Lo fanno gli stessi editori di giornali sulle loro pagine, lo fanno le pubbliche amministrazioni nei limiti in cui la legge glielo impone, lo fanno i gestori dei siti di annunci e lo fanno tanti altri soggetti diversi pubblici e privati. In questo caso il dubbio è il seguente: quando si pubblicano online dei dati personali non li si abbandona alla deriva come si trattasse di relitti ma li si pubblica per finalità specifiche e determinate.
Gli editori in ossequio al diritto di cronaca, le pubbliche amministrazioni in ossequio, ad esempio, alla disciplina sulla trasparenza e a quella sulla pubblicità legale, i gestori dei siti di annuncio sulla base di un contratto con il l’estensore dell’annuncio ecc. Nessuno pubblica i contenuti in questione perché diventino cibo per gli algoritmi dei giganti dell’intelligenza artificiale.
E, quindi, la domanda è questa: consapevoli del fenomeno della pesca a strascico anche di dati personali in corso, i gestori dei siti internet pubblici e privati che agiscono da titolari del trattamento non dovrebbero fare quanto possibile allo stato della tecnica e quanto ragionevole, anche in un rapporto costi-benefici, per proteggere i “loro” [nostri in realtà] dati personali? Si tratta di una questione sin qui poco discussa in relazione alla quale al Garante per la protezione dei dati personali abbiamo appena approvato questo documento di indirizzo la cui lettura potrebbe risultare utile almeno a promuovere un dialogo. Internet non è un data all you can eat restaurant per pochi client facoltosi e neppure sempre paganti.
Come sempre se volete saperne di più su quello che è accaduto in settimana in giro per il mondo su dati, privacy e dintorni, potete leggere qui le notizie quotidiane di PrivacyDaily o iscrivervi alla newsletter di #cosedagarante.