Ang nakakagulat na cost-effective na modelo ng AI na hamon sa mga higanteng industriya ng AI. Sa una ay na -tout bilang nagkakahalaga lamang ng $ 6 milyon upang sanayin, ang Deepseek V3, isang malakas na network ng neural, ay naging isang pangunahing katunggali, kahit na nagdudulot ng makabuluhang pagbagsak ng stock para sa nvidia. Gayunpaman, ang totoong gastos ay mas mataas.
Larawan: ensigame.com
Ang tagumpay ng Deepseek ay nagmumula sa isang kumbinasyon ng mga makabagong teknolohiya: multi-token prediction (MTP) para sa pinahusay na kawastuhan at kahusayan; Pinaghalong mga eksperto (MOE) na gumagamit ng 256 neural network para sa pinabilis na pagsasanay; at multi-head latent pansin (MLA) para sa pinahusay na pagkuha ng impormasyon.
Larawan: ensigame.com
Taliwas sa mga paunang pag -angkin, ang semianalysis ay nagsiwalat ng malaking imprastraktura ng Deepseek: humigit -kumulang 50,000 NVIDIA GPU, na nagkakahalaga ng halos $ 1.6 bilyon, na may mga gastos sa pagpapatakbo na umaabot sa $ 944 milyon. Ito ay kaibahan nang matindi sa naisapubliko na $ 6 milyong gastos sa pre-pagsasanay, na tinatanggal ang pananaliksik, pagpipino, pagproseso ng data, at pangkalahatang gastos sa imprastraktura.
Larawan: ensigame.com
Ang natatanging istraktura ng Deepseek, isang subsidiary ng high-flyer, isang pondo ng hedge ng Tsino, ay nagbibigay-daan para sa mabilis na pagbabago at paggawa ng desisyon. Ang pagmamay -ari ng mga sentro ng data nito ay nagbibigay ng kumpletong kontrol sa pag -optimize. Ang malaking pamumuhunan ng kumpanya na lumampas sa $ 500 milyon, kasabay ng mataas na suweldo na umaakit sa nangungunang talento ng Tsino (higit sa $ 1.3 milyon taun -taon para sa ilang mga mananaliksik), na malaki ang naambag sa mapagkumpitensyang gilid nito.
Larawan: ensigame.com
Habang ang salaysay na "friendly" ng Deepseek ay maaaring mapalaki, ang tagumpay nito ay nagtatampok ng potensyal ng mahusay na pinondohan na independiyenteng mga kumpanya ng AI. Ang kaibahan ng mga gastos sa pagsasanay-$ 5 milyon ng Deepseek para sa $ 100 milyon ng Chatgpt para sa 4o-binibigyang diin ang kamag-anak na pagiging epektibo ng Deepseek, kahit na sa malaking aktwal na pamumuhunan. Ang kwento ng tagumpay ng kumpanya, gayunpaman, ay mas tumpak na maiugnay sa makabuluhang pamumuhunan, pagsulong sa teknolohiya, at isang mataas na bihasang manggagawa.