Non si placa la battaglia contro il web scraping. Dopo l’azione legale promossa nel 2023 dal New York Times contro Microsoft e OpenAI, negli USA altre otto testate giornalistiche del gruppo editoriale Alden Global Capital scendono in campo e fanno causa alle società di Sam Altman e di Satya Nadella (Google) per presunta violazione del copyright.
Le accuse indirizzate a OpenAI
L’accusa è sempre quella di aver usato illecitamente enormi quantità di dati e contenuti protetti dal diritto d’autore per addestrare e alimentare i modelli di intelligenza artificiale.
I nuovi querelanti, contrariamente al NYT che ha chiesto un risarcimento di miliardi di dollari di danni, rivendicano un compenso per tutti i contenuti che le due società avrebbero utilizzato senza chiedere alcun permesso.
ChatGPT e Copilot leggono i giornali
Nelle 294 pagine depositate dinnanzi alla Corte Federale negli Stati Uniti – Distretto meridionale di New York compaiono diversi estratti di conversazioni sia con ChatGPT che con Copilot che mostrano che entrambi i chatbot hanno riprodotto lunghi estratti di articoli bypassando il paywall in totale spregio alla titolarità dei diritti detenuti dai giornali da cui avevano preso indebitamente l’articolo.
Leggi anche: Intelligenza artificiale: più che lavori rubati, lavori negati
“Questa causa non è una battaglia tra la nuova tecnologia e la vecchia tecnologia. Non è una battaglia tra un’industria fiorente e un’industria in transizione. Sicuramente non è una battaglia per risolvere il dibattito sulle questioni sociali, politiche, morali ed economiche che l’intelligenza artificiale generativa solleva. Questa causa riguarda il perché Microsoft e OpenAI non hanno il diritto di utilizzare contenuti di giornali protetti da copyright per costruire le loro nuove imprese da trilioni di dollari senza pagare per quel contenuto”, si legge nella denuncia.
Il quesito giuridico che dovrà affrontare la Corte distrettuale di New York è il seguente: premesso che i modelli di intelligenza artificiale generativa vengono attualmente addestrati su enormi quantità di dati – e utilizzano materiali protetti da copyright in quanto sono contenuti di alta qualità – l’utilizzo di tali dati è da considerarsi una violazione del copyright?
Leggi anche: La biometria mette le ali. Quali dati diamo alle compagnie aeree?
Open AI ha già avuto modo di difendersi invocando a sua discolpa il fair use, ossia l’eccezione di diritto statunitense che permette di elaborare opere esistenti per crearne di nuove senza incorrere in violazioni di legge. Da capire caso per caso se l’opera “derivata” appaia come la copia dell’originale con piccole differenze o sia realmente una nuova creazione.
Il responso dei giudici potrebbe non essere imminente ma le varie cause legali hanno spinto Microsoft e OpenAI a correre ai ripari e sottoscrivere degli accordi di licenza con i principali giornali on line per alimentare ChatGpt; finora, con l’Associated Press, El Paìs, Financial Times e Le Monde.
Come sempre se volete saperne di più su quello che è accaduto in settimana in giro per il mondo su dati, privacy e dintorni, potete leggere qui le notizie quotidiane di PrivacyDaily o iscrivervi alla newsletter di #cosedagarante.