L’addestramento dell’intelligenza artificiale generativa richiede una grande quantità di dati. Spesso però le aziende che si occupano dello sviluppo di questa tecnologia non sono risultate trasparenti riguardo l’utilizzo delle proprietà intellettuali altrui a questo scopo, come dimostrano diverse cause legali intentate nei loro confronti da individui o da intere società. Il caso più recente è quello di Scarlett Johansson, che ha accusato OpenAI di aver utilizzato la sua voce, o una molto simile, per i suoi di ChatGPT 4 in modo che somigliasse a quella dell’intelligenza artificiale del film Her, per la quale l’attrice aveva funto da doppiatrice.

L’ultima frontiera dell’intelligenza artificiale generativa è però la musica. Sony e Universal, due delle più grandi etichette discografiche al mondo, hanno recentemente preso provvedimenti per difendere le voci dei loro cantanti, in modo che l’AI non potesse utilizzarle per addestrarsi. Altre realtà però hanno deciso di approfittare di questa opportunità per strappare contratti milionari. È il caso del social network Reddit, tra i più longevi esistenti, che ha siglato accordi con Google e OpenAI proprio per fornire i propri dati ai loro Large Language Model.

Scarlett Johansson contro OpenAI, il caso Her

L’ultimo caso scoppiato per l’utilizzo da parte di una società che si occupa di intelligenza artificiale di dati a cui non avrebbe dovuto avere accesso è quello che riguarda l’attrice americana Scarlett Johansson e OpenAI. Nelle scorse settimane il Ceo dell’azienda Sam Altman aveva fatto intendere che il chatbot prodotto dall’azienda, ChatGPT, avrebbe presto potuto parlare con gli utenti utilizzando varie voci.

Una di queste, chiamata Sky, ha ricordato a diversi utenti quella di Samantha, l’AI del film del 2013 Her. Questa pellicola, ambientata in un futuro prossimo, raccontava del legame che il protagonista stringeva un legame affettivo con un’intelligenza artificiale che gli faceva da assistente. La voce del software, nella versione inglese, era proprio quella di Scarlett Johansson.

L’attrice si è detta scioccata da quanto accaduto, specialmente per il comportamento di Sam Altman. Il Ceo di OpenAI l’avrebbe infatti contattata chiedendole la disponibilità a prestare la voce per ChatGPT, la Johansson aveva rifiutato. Altman avrebbe quindi ignorato la sua volontà. Tra l’altro, poco prima dell’uscita dei primi demo della nuova funzionalità di ChatGPT, lo stesso dirigente ha scritto sul social X (Twitter) un post che recitava semplicemente “Her”.

“In un’epoca in cui siamo alle prese con i deepfake e con la tutela della nostra immagine, del nostro lavoro, della nostra identità, credo che queste siano domande che meritano assoluta chiarezza. Attendo con impazienza una soluzione trasparente e l’approvazione di una legislazione adeguata per garantire la tutela dei diritti individuali” ha dichiarato Johansson.

OpenAI si è difesa dicendo di aver utilizzato la voce di un’altra attrice per Sky e di non aver avuto alcuna intenzione di imitare quella di Johansson. L’attrice che ha prestato la voce per il film Her ha però assunto un team legale per affrontare la questione.

Sony e Universal contro l’AI: la musica si difende

Anche diverse case discografiche si stanno adattando all’arrivo sul mercato dell’intelligenza artificiale generativa. Questa tecnologia si è dimostrata in grado di ricreare facilmente voci di cantanti e di generare canzoni, addestrandosi sui dati delle tracce più famose. Sony ha però avvisato nel maggio di quest’anno tutte le società che si occupano di LLM: i brani dei suoi artisti, tra i quali spiccano Beyoncé e Adele tra gli altri, non potranno categoricamente essere utilizzati per l’addestramento dell’AI. Ogni trasgressione in questo senso sarà trattata dall’azienda come una violazione di copyright.

Vicenda simile quella di Universal, altra etichetta discografica molto importante che rappresenta la pop star più famosa al mondo, Taylor Swift, ha trascinato una trattativa durata mesi con TikTok anche a causa dell’intelligenza artificiale. Il colosso della musica ha spinto il social network cinese ad impegnarsi per proteggere i brani dei suoi cantanti dal machine learning, arrivando a togliere tutte le tracce degli artisti che rappresenta da TikTok. L’accordo raggiunto ha accettato questa condizione, una scelta apparentemente indolore per il social cinese, che però potrebbe in futuro togliere a Bytedance, società che lo controlla, una possibile fonte di incassi.

L’idea di Reddit: i contratti con Google e OpenAI

Non tutti però hanno scelto di combattere contro l’avanzata dell’AI. Un social network ha deciso di sfruttarla, ricavandone più fondi possibili per diversificare le proprie fonti di ricavi. Reddit è tra i più longevi e attivi social al mondo. Nato nel 2005, tre anni prima di Facebook, è erede della tradizione dei forum e dell’internet 1.0. È diviso in “sub” tematici, dove gli utenti possono discutere degli argomenti più disparati. Di recente, Reddit ha deciso di quotarsi in borsa, con risultati discreti che hanno superato un certo scetticismo iniziale di utenti e investitori.

Come azienda quotata però, Reddit ha dovuto affrontare un problema che ogni social ha: la monetizzazione. Nessuna piattaforma ha ancora trovato un modo di staccarsi dal modello pubblicitario, che comporta problematiche di diversa natura soprattutto legate ai contenuti che possono apparire sul social stesso. Gli inserzionisti sono molto attenti a non far apparire i propri prodotti a fianco di post controversi e quindi richiedono una moderazione molto severa. Inoltre, non è sempre semplice superare le perdite con i soli ricavi pubblicitari.

Gli abbonamenti sono un’opzione, ma non sembrano in grado di competere a livello di ricavi con gli annunci. Per ovviare a questo problema, Reddit ha pensato proprio all’AI. A febbraio, pochi mesi prima della sua quotazione in Borsa, l’agenzia di stampa britannica Reuters ha rivelato che il social network aveva siglato un accordo con Alphabet, la parent company di Google. Il colosso avrebbe utilizzato le conversazioni tra utenti di Reddit per addestrare la propria intelligenza artificiale. L’accesso ai dati sarebbe però costato 60 milioni di dollari, che sarebbero andati nelle casse del social network all’anno.

Pochi mesi dopo, a titolo ormai quotato in Borsa, un’altra notizia del tutto simile è circolata. Questa volta però a firmare l’accordo sarebbe stata OpenAI. Anche GPT potrà utilizzare Reddito come fonte di dati, anche se in questo caso il prezzo dell’accesso non è stato reso noto. È però verosimile supporre che la cifra non si distanzi molto da quella pagata da Google