Deepseek'in şaşırtıcı derecede uygun maliyetli AI modeli endüstri devlerine meydan okuyor. Başlangıçta eğitmek için sadece 6 milyon dolara mal olan güçlü bir sinir ağı olan Deepseek V3, NVIDIA için önemli stok düşüşlerine neden olan büyük bir rakip haline geldi. Ancak, gerçek maliyet çok daha yüksektir.
Resim: ensigame.com
Deepseek'in başarısı, yenilikçi teknolojilerin bir kombinasyonundan kaynaklanmaktadır: iyileştirilmiş doğruluk ve verimlilik için çoklu eğimli tahmin (MTP); Hızlandırılmış eğitim için 256 sinir ağını kullanan uzmanların (MOE) karışımı; ve gelişmiş bilgi çıkarma için çok başlı gizli dikkat (MLA).
Resim: ensigame.com
İlk iddiaların aksine, Semianaliz Deepseek'in önemli altyapısını ortaya çıkardı: yaklaşık 50.000 NVIDIA GPU, yaklaşık 1.6 milyar dolar değerinde, operasyonel maliyetler 944 milyon dolara ulaştı. Bu, araştırma, iyileştirme, veri işleme ve genel altyapı masraflarını atlayan 6 milyon dolarlık eğitim öncesi maliyetle keskin bir tezat oluşturuyor.
Resim: ensigame.com
Bir Çin Hedge Fonu olan High-Flyer'in bir yan kuruluşu olan Deepseek'in benzersiz yapısı, hızlı inovasyon ve karar verme sürecine izin veriyor. Veri merkezlerine sahip olmak, optimizasyon üzerinde tam kontrol sağlar. Şirketin 500 milyon doları aşan önemli yatırımları, en iyi Çin yeteneklerini (bazı araştırmacılar için yıllık 1,3 milyon doların üzerinde) çeken yüksek maaşlarla birleştiğinde, rekabet avantajına önemli ölçüde katkıda bulunuyor.
Resim: ensigame.com
Deepseek'in "bütçe dostu" anlatısı tartışmalı olarak şişirilirken, başarısı iyi finanse edilen bağımsız AI şirketlerinin potansiyelini vurgulamaktadır. Eğitim maliyetlerindeki keskin kontrast-Deepseek'in R1 için 5 milyon $ 'a karşı ChatGPT'nin 4o için 100 milyon $' ı-Deepseek'in göreceli maliyet etkinliğinin altını çiziyor. Bununla birlikte, şirketin başarı öyküsü, önemli yatırımlara, teknolojik gelişmelere ve yüksek vasıflı bir işgücüne daha doğru bir şekilde atfedilmektedir.