De deepseek's verrassend kosteneffectieve AI-model daagt reuzen uit de industrie uit. Aanvankelijk aangeprezen als kosten voor slechts $ 6 miljoen om te trainen, is Deepseek V3, een krachtig neuraal netwerk, een belangrijke concurrent geworden en zelfs aanzienlijke aandelendruppels veroorzaakt voor Nvidia. De werkelijke kosten zijn echter veel hoger.
Afbeelding: ensigame.com
Het succes van Deepseek komt voort uit een combinatie van innovatieve technologieën: multi-token voorspelling (MTP) voor verbeterde nauwkeurigheid en efficiëntie; Mix van experts (MOE) met behulp van 256 neurale netwerken voor versnelde training; en multi-head latente aandacht (MLA) voor verbeterde informatie-extractie.
Afbeelding: ensigame.com
In tegenstelling tot de initiële claims onthulde de semianalyse de substantiële infrastructuur van Deepseek: ongeveer 50.000 NVIDIA GPU's, met een waarde van ongeveer $ 1,6 miljard, met operationele kosten van $ 944 miljoen. Dit contrasteert scherp met de gepubliceerde $ 6 miljoen pre-trainingskosten, die onderzoek, verfijning, gegevensverwerking en algemene infrastructuurkosten weglaten.
Afbeelding: ensigame.com
De unieke structuur van Deepseek, een dochteronderneming van high-flyer, een Chinees hedgefonds, zorgt voor snelle innovatie en besluitvorming. Het bezitten van zijn datacenters biedt volledige controle over optimalisatie. De substantiële investering van het bedrijf van meer dan $ 500 miljoen, in combinatie met hoge salarissen die het beste Chinees talent aantrekken (voor sommige onderzoekers meer dan sommige onderzoekers), draagt aanzienlijk bij aan het concurrentievoordeel.
Afbeelding: ensigame.com
Hoewel het "budgetvriendelijke" verhaal van Deepseek aantoonbaar is opgeblazen, benadrukt het succes het potentieel van goed gefinancierde onafhankelijke AI-bedrijven. Het grimmige contrast in trainingskosten-Deepseek's $ 5 miljoen voor R1 versus Chatgpt's $ 100 miljoen voor 4O-onderstreept de relatieve kosteneffectiviteit van Deepseek, zelfs met zijn substantiële werkelijke investering. Het succesverhaal van het bedrijf wordt echter nauwkeuriger toegeschreven aan aanzienlijke investeringen, technologische vooruitgang en een zeer bekwame personeelsbestand.