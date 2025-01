Fonte: 123RF DeepSeek-R1: come il nuovo modello di AI cinese sfida il predominio USA

Un nuovo protagonista sta emergendo nel panorama dell’intelligenza artificiale globale. Questa volta non proviene dagli Stati Uniti: si tratta di DeepSeek, un laboratorio cinese specializzato nello sviluppo di modelli linguistici open-source all’avanguardia.

L’applicazione cinese DeepSeek R-1, basata su modelli di intelligenza artificiale generativa, ha conquistato nelle ultime ore la vetta della classifica dei download gratuiti dell’App Store sia in Cina che negli Stati Uniti, superando persino il popolare ChatGpt.

Come è nato DeepSeek

Nato nel 2023 come parte del fondo quantitativo High-Flyer, DeepSeek ha rapidamente conquistato l’attenzione mondiale grazie ai suoi modelli innovativi. In particolare, il lancio di DeepSeek-R1 nel gennaio 2025 ha scatenato un vero e proprio fermento all’interno della comunità dell’intelligenza artificiale. Il motivo? DeepSeek sostiene che il R1 non solo eguagli ma addirittura superi il modello OpenAI-o1, su numerosi benchmark chiave, operando però a un costo notevolmente inferiore.

La start-up afferma di aver fatto significativi progressi nell’addestramento dei modelli, utilizzando un numero di chip Nvidia notevolmente inferiore rispetto ai concorrenti statunitensi. Ciò alimenta il dubbio che i miliardi di dollari investiti dalla Silicon Valley nell‘intelligenza artificiale nell’ultimo anno siano stati sovrastimati.

Il successo di DeepSeek-R1 si fonda su una serie di innovazioni architetturali. Una delle principali è il Multi-head Latent Attention (MLA), una tecnica che consente di ridurre il consumo di memoria del 40%, rendendo il modello più efficiente. Un’altra caratteristica distintiva è l’Architettura Mixture-of-Experts (MoE), che permette all’intelligenza artificiale cinese di attivare solo una parte dei suoi 671 miliardi di parametri per ogni input, ottimizzando così le risorse computazionali.

Come l’azienda ha superato le sanzioni statunitensi

Aspetto particolarmente interessante dello sviluppo di DeepSeek-R1 è come il team sia riuscito a superare le restrizioni imposte dal governo degli Stati Uniti sull’esportazione di semiconduttori avanzati verso la Cina. La decisione di High-Flyer di avventurarsi nell’AI è direttamente collegata a questi vincoli; molto prima delle sanzioni, il fondatore Liang Wenfeng ha acquistato una notevole scorta di chip Nvidia A100, un tipo ora vietato all’esportazione in Cina. Si stima che DeepSeek disponga di una quantità di questi chip fra le 10mila e le 50mila unità.

Il riconoscimento del potenziale di queste scorte per l’addestramento dell’AI ha spinto Liang a fondare DeepSeek, che ha potuto utilizzarle in combinazione con i chip a più bassa potenza per sviluppare i suoi modelli.

Quali rischi per la sicurezza

Nonostante le sue impressionanti capacità tecniche, DeepSeek-R1 solleva anche importanti questioni legate alla sicurezza dei dati. I legami stretti di Wenfeng con il Partito Comunista Cinese sollevano preoccupazioni riguardo a possibili casi di spionaggio tecnologico, con il Partito che si è sempre più concentrato sulla ricerca e sviluppo nell’intelligenza artificiale negli Stati Uniti.

Inoltre, la capacità di DeepSeek di elaborare e analizzare vasti set di dati in tempo reale lo rende uno strumento potente per identificare vulnerabilità nei sistemi complessi. A differenza degli attacchi informatici tradizionali, che si basano sull’individuazione manuale di punti deboli in reti, software o infrastrutture, DeepSeek è in grado di automatizzare questo processo a una velocità e scala senza precedenti.

Se non adeguatamente controllato, DeepSeek potrebbe non solo potenziare le capacità informatiche della Cina, ma anche ridefinire le norme globali sulla privacy e la sicurezza dei dati, con impatti a lungo termine sulle istituzioni democratiche e sulle libertà individuali.