In questi giorni è esploso il fenomeno DeepSeek, la nuova intelligenza artificiale cinese simile a ChatGPT ma con costi e richieste energetiche inferiori. Le sue performance sono state tali da generare una crisi nei mercati occidentali, con i titoli tecnologici legati soprattutto ai processori che ieri hanno sofferto molto.
Nvidia, il colosso delle schede grafiche, ha perso il 17% ma in generale tutto il segmento collegato all’AI ha avuto un brusco risveglio. Broadcom ha perso il 17%, TSMC il 15% e giganti come Microsoft e Alphabet (Google) ieri erano in flessione del 3%.
Perfino il mercato crypto ha subito le performance dell’AI cinese. Ieri Bitcoin ha registrato una flessione di circa il 6%, scendendo al di sotto dei 100.000 dollari e toccando un minimo di 98.852,17 dollari. Questo calo ha trascinato al ribasso l’intero comparto crypto, con le migliori criptovalute legate all’intelligenza artificiale che hanno subito perdite significative. Ad esempio, AIOZ Network (AIOZ) ha registrato una flessione del 10,2%, Render (RENDER) ha perso il 9,3% e Arweave (AR) ha subito un calo del 9,4%.
Ma andiamo con ordine e vediamo che cos’è DeepSeek e come funziona.
Che cos’è DeepSeek
DeepSeek è una startup cinese di intelligenza artificiale con sede a Hangzhou, fondata nel 2023 da Liang Wenfeng. Nonostante le restrizioni statunitensi sull’esportazione di chip avanzati verso la Cina, DeepSeek ha sviluppato il modello di IA R1 utilizzando i chip Nvidia H800, meno potenti ma più accessibili.
Questo approccio ha permesso all’azienda di contenere i costi di sviluppo a meno di 6 milioni di dollari, una piccola frazione dei budget impiegati dai concorrenti occidentali.
Il costo stimato per addestrare GPT-3, il predecessore di ChatGPT, è stato di circa 12 milioni di dollari solo per la fase di addestramento. Successivamente, con GPT-4, i costi sono aumentati ulteriormente, considerando la complessità maggiore del modello e la necessità di utilizzare infrastrutture di calcolo avanzate, come i chip NVIDIA A100 e H100, per eseguire miliardi di calcoli.
In soldoni, il costo complessivo dell’addestramento dell’AI di Open AI viene stimato tra i 100 milioni e il miliardo di dollari. Una differenza sostanziale che ha messo in crisi non solo le aziende ma anche tutto il modello AI statunitense.
Il segreto per rendere parsimonioso DeepSeek è il suo modo di “ragionare”. Invece di essere addestrato su tanti più contenuti possibili, l’AI cinese è in grado di imparare tramite un sistema di ricompense e punizioni, che permettono a DeepSeek-R1 di funzionare meglio degli altri modelli.
Un altro punto di forza è la sua architettura nota come MoE o Mixture of Experts. In pratica, invece di essere utilizzata tutta l’intelligenza artificiale ogni volta, il sistema seleziona solo la parte di esperti che possono rispondere a una domanda, permettendo un risparmio significativo delle risorse.
Infine, DeepSeek utilizza tecniche di distillazione per utilizzare solo una parte delle sue risorse. Per farlo crea un modello simile, ma limitato e meno performante, in grado di rispondere in maniera identica, ma con un utilizzo limitato di calcolo ed energia.
DeepSeek è meglio di ChatGPT?
Al momento i due modelli si equivalgono, ma ChatGPT è costato molto di più in termini di sviluppo e oltretutto DeepSeek è un progetto open source gratuito mentre ChatGPT è a pagamento nella versione PLUS. Certo, al momento DeepSeek non può generare immagini, ma è disponibile come il modello di Open AI anche in versione App.
Tra l’altro parliamo dell’app più scaricata in assoluto nell’Apple Store (per iPhone) dove ha superato i modelli concorrenti come Google Gemini, Genie AI, Perplexity e via discorrendo.
In rete trovate diversi benchmark che mettono a confronto le due tecnologie su scenari e problemi diversi, ma in realtà il nocciolo della questione è legato soprattutto alle due nazioni coinvolte: la Cina e gli USA.
Ad oggi sembra evidente che DeepSeek abbia utilizzato meglio le risorse a disposizione. Del resto, è proprio la necessità a stimolare l’ingegno, e spesso le limitazioni portano a risultati straordinari. Basti pensare alle limitazioni dei primi home computer, quando gli sviluppatori riuscivano a creare giochi meravigliosi in pochi Kilobytes di memoria.
DeepSeek: l’arma pubblicitaria della Cina contro l’Occidente
DeepSeek non è solo un modello di intelligenza artificiale open source, è un vero e proprio spot della Cina per il mondo. Il fatto che un Paese noto per il suo controllo stretto sulla tecnologia e sulla proprietà intellettuale abbia deciso di rilasciare gratuitamente un progetto di tale portata è sorprendente, quasi una contraddizione.
L’open source, che in altri contesti sarebbe stato quasi “una bestemmia” per le strategie cinesi, qui diventa una mossa studiata: un mezzo per promuovere la superiorità tecnologica del Paese e mettere in crisi il paradigma occidentale, fondato su modelli chiusi e costosi come quelli di OpenAI.
Non si tratta solo di una piattaforma di IA, ma di un veicolo pubblicitario per dimostrare che la Cina non solo può competere, ma può farlo a condizioni che sfidano le regole del gioco imposte dall’Occidente.
Esiste però anche un rovescio della medaglia. Provate a chiedere a DeepSeek di parlare dei diritti civili in Cina e riceverete una risposta piuttosto controversa, molto diversa da quella fornita da ChatGPT.
Il motivo è evidente: DeepSeek è una versione censurata di ChatGPT, dove le risposte a domande scomode vengono riformulate ad arte per allinearsi alla narrativa del governo cinese. Nonostante il modello si presenti come open source, un dettaglio che potrebbe suggerire trasparenza e libertà, DeepSeek rimane una IA fortemente censurata, un aspetto che solleva molteplici questioni critiche.
La natura open source non cancella la censura
È vero, DeepSeek consente agli sviluppatori di accedere al codice sorgente e di personalizzarlo. Tuttavia, la censura è radicata nel cuore del modello. E non è difficile accorgersene.
Domande su argomenti politicamente sensibili come le proteste di Piazza Tiananmen o l’indipendenza di Taiwan vengono eluse o edulcorate, offrendo risposte che evitano con cura ogni riferimento critico.
Allo stesso modo, termini come “diritti umani in Cina” o “sorveglianza di massa” generano spesso risposte generiche e prive di qualsiasi analisi sostanziale. E se si tenta di sollevare questioni spinose, come la situazione degli uiguri nello Xinjiang, il modello scivola in narrazioni propagandistiche che enfatizzano solo i presunti “benefici” delle politiche statali.