Mediaset alza barriere nei confronti dell’Intelligenza artificiale. Da qualche settimana mette in chiaro che i suoi programmi non sono a disposizione per l’addestramento di algoritmi. Su tutti i titoli di coda compare questo annuncio: “È severamente vietato ogni utilizzo delle immagini trasmesse atto all’addestramento di sistemi di intelligenza artificiale generativa, così come l’utilizzo di mezzi automatizzati di ‘data scraping’”. La notizia è riportata da Wired. 

Cosa significa? Si tratta di una dicitura funzionale alla tutela dei propri contenuti -un disclaimer- per proteggerli da utilizzi non autorizzati per lo sviluppo dei sistemi di AI. La scelta arriva in un momento in cui il confine tra utilizzo legittimo dei dati e violazione del diritto d’autore si assottiglia sempre di più.

appropriazione indebita

L’azienda di Cologno Monzese ha sempre difeso i contenuti dei propri programmi dalle forme di appropriazione indebita, in nome del diritto d’autore. Nell’era dell’Intelligenza artificiale Rti (Reti televisive italiane, controllata di Mediaset per le produzioni tv) vuole difendersi da una pratica messa in atto da alcune aziende che sviluppano sistemi di Intelligenza artificiale: il “data scraping”. Ossia la “pesca a strascico” in modo automatizzato di dati disponibili in rete e non solo, da dare in pasto agli algoritmi al fine di “allenarli”. Se nella rete -spiega Wired- finiscono i contenuti di una società editoriale, come un articolo di giornale o una pillola di un programma di tv, si incappa nella violazione del diritto d’autore. È il motivo per cui il New York Times ha fatto causa a OpenAI e Microsoft, per aver utilizzato i propri articoli per “addestrare” i rispettivi ChatGPT e Copilot.

Oggi esiste però una falla legislativa che permette agli sviluppatori di Intelligenza artificiale di fare incetta di prodotti editoriali. Si trova nell’articolo 4 della direttiva europea 70 del 2019, meglio nota come Direttiva Copyright (recepita in Italia dal decreto legislativo 177 del 2021). Questa direttiva prevede infatti un’eccezione al text and data mining (Tdm), ovvero l’estrazione di testo e dati sui contenuti protetti dal diritto d’autore. Questa norma consente l’estrazione dei dati su materiale coperto da copyright ai fini dell’addestramento algoritmico dei sistemi di AI generativa, a meno che non intervenga un espresso dissenso da parte del titolare dei diritti.

principio rovesciato 

Secondo questa impostazione, il principio su cui è basata la legge sul diritto d’autore è rovesciato: non è più l’autore a decidere le modalità con cui concedere i diritti sulle proprie opere, ma il loro utilizzo per l’implementazione dei sistemi di AI generativa come ChatGPT, Dall-E e Mid-Journey risulta legittimato a monte. L’unica forma di tutela concessa dalla Direttiva Copyright e dalla legge italiana per il diritto di autore rimane quella di esprimere il cosidetto “opt-out”, ovvero una dichiarazione esplicita che esclude un determinato contenuto da ogni tipo di utilizzo finalizzato ad addestrare gli algoritmi dei sistemi di AI. 

Nella strategia di Mediaset, l’inclusione del disclaimer funge da “scudo” perché esplicita il divieto all’uso dei suoi programmi nell’allenamento di modelli di Intelligenza artificiale. A regolare in maniera più stretta il tema sarà l’AI Act, il regolamento europeo sull’intelligenza artificiale, in queste settimane al ciclo di approvazioni finali da parte del Consiglio europeo (2 febbraio, la data prevista) ed Europarlamento (entro aprile).

LASCIA UN COMMENTO