El modelo de IA sorprendentemente rentable de Deepseek desafía a los gigantes de la industria. Inicialmente promocionado como costando solo $ 6 millones para entrenar, Deepseek V3, una poderosa red neuronal, se ha convertido en un importante competidor, incluso causando importantes caídas de acciones para NVIDIA. Sin embargo, el verdadero costo es mucho más alto.
Imagen: ensigame.com
El éxito de Deepseek proviene de una combinación de tecnologías innovadoras: predicción múltiple (MTP) para mejorar la precisión y eficiencia; Mezcla de expertos (MOE) utilizando 256 redes neuronales para capacitación acelerada; y atención latente múltiple (MLA) para una extracción de información mejorada.
Imagen: ensigame.com
Al contrario de las afirmaciones iniciales, el semianálisis reveló la infraestructura sustancial de Deepseek: aproximadamente 50,000 GPU NVIDIA, valoradas en alrededor de $ 1.6 mil millones, con costos operativos que alcanzan los $ 944 millones. Esto contrasta fuertemente con el costo de pre-entrenamiento de $ 6 millones publicitado, que omite la investigación, el refinamiento, el procesamiento de datos y los gastos generales de infraestructura.
Imagen: ensigame.com
La estructura única de Deepseek, una subsidiaria de High-Flyer, un fondo de cobertura chino, permite la innovación rápida y la toma de decisiones. Ser propietario de sus centros de datos proporciona un control completo sobre la optimización. La inversión sustancial de la compañía superior a los $ 500 millones, junto con los altos salarios que atraen al máximo talento chino (más de $ 1.3 millones anuales para algunos investigadores), contribuye significativamente a su ventaja competitiva.
Imagen: ensigame.com
Si bien la narrativa "económica" de Deepseek está posiblemente inflada, su éxito destaca el potencial de las compañías de IA independientes bien financiadas. El marcado contraste en los costos de capacitación, los $ 5 millones de Deepseek por R1 versus los $ 100 millones de Chatgpt por 4O, subraya la rentabilidad relativa de Deepseek, incluso con su inversión real sustancial. Sin embargo, la historia de éxito de la compañía se atribuye con mayor precisión a una inversión significativa, avances tecnológicos y una fuerza laboral altamente calificada.