Il modello di intelligenza artificiale sorprendentemente conveniente di Deepseek sfida i giganti del settore. Inizialmente propagandati come costi solo $ 6 milioni per addestrare, Deepseek V3, una potente rete neurale, è diventato un grande concorrente, causando anche significativi calo di scorta per Nvidia. Tuttavia, il vero costo è molto più alto.
Immagine: Ensigame.com
Il successo di DeepSeek deriva da una combinazione di tecnologie innovative: previsione multi-token (MTP) per una migliore precisione ed efficienza; Miscela di esperti (MOE) utilizzando 256 reti neurali per la formazione accelerata; e attenzione latente multi-testa (MLA) per un'estrazione di informazioni avanzate.
Immagine: Ensigame.com
Contrariamente alle affermazioni iniziali, la seminalisi ha rivelato una sostanziale infrastruttura di DeepSeek: circa 50.000 GPU NVIDIA, valutate a circa $ 1,6 miliardi, con costi operativi che hanno raggiunto $ 944 milioni. Ciò contrasta bruscamente con i costi di pre-formazione pubblicizzati da 6 milioni di dollari, che omette la ricerca, la raffinatezza, l'elaborazione dei dati e le spese complessive di infrastruttura.
Immagine: Ensigame.com
La struttura unica di DeepSeek, una consociata di High-Flyer, un hedge fund cinese, consente una rapida innovazione e processo decisionale. Possedere i suoi data center fornisce il controllo completo sull'ottimizzazione. Gli investimenti sostanziali della società superano i $ 500 milioni, uniti ad alti salari che attirano i migliori talenti cinesi (oltre $ 1,3 milioni all'anno per alcuni ricercatori), contribuiscono in modo significativo al suo vantaggio competitivo.
Immagine: Ensigame.com
Mentre la narrazione "economica" di Deepseek è probabilmente gonfiata, il suo successo evidenzia il potenziale di società di intelligenza artificiale indipendenti ben finanziate. Il netto contrasto nei costi di formazione-$ 5 milioni di DeepSeek per R1 contro $ 100 milioni di CHATGPT per 4O-sottolinea il rapporto di costo relativo di Deepseek, anche con il suo sostanziale investimento reale. La storia di successo dell'azienda, tuttavia, è più accuratamente attribuita a investimenti significativi, progressi tecnologici e una forza lavoro altamente qualificata.