Mô hình AI hiệu quả đáng ngạc nhiên của Deepseek thách thức những người khổng lồ trong ngành. Ban đầu được quảng cáo là chỉ tốn 6 triệu đô la để đào tạo, Deepseek V3, một mạng lưới thần kinh mạnh mẽ, đã trở thành một đối thủ cạnh tranh lớn, thậm chí gây ra sự sụt giảm đáng kể cho NVIDIA. Tuy nhiên, chi phí thực sự cao hơn nhiều.
Hình ảnh: Ensigame.com
Thành công của Deepseek bắt nguồn từ sự kết hợp của các công nghệ sáng tạo: Dự đoán đa điểm (MTP) để cải thiện độ chính xác và hiệu quả; Hỗn hợp các chuyên gia (MOE) sử dụng 256 mạng lưới thần kinh để đào tạo tăng tốc; và sự chú ý tiềm ẩn đa đầu (MLA) để trích xuất thông tin nâng cao.
Hình ảnh: Ensigame.com
Trái với các tuyên bố ban đầu, Semianalysis cho thấy cơ sở hạ tầng đáng kể của Deepseek: khoảng 50.000 GPU NVIDIA, trị giá khoảng 1,6 tỷ đô la, với chi phí hoạt động lên tới 944 triệu đô la. Điều này trái ngược hoàn toàn với chi phí đào tạo trước 6 triệu đô la được công khai, bỏ qua nghiên cứu, tinh chỉnh, xử lý dữ liệu và chi phí cơ sở hạ tầng tổng thể.
Hình ảnh: Ensigame.com
Cấu trúc độc đáo của Deepseek, một công ty con của High Flyer, một quỹ phòng hộ của Trung Quốc, cho phép đổi mới nhanh chóng và ra quyết định. Sở hữu các trung tâm dữ liệu của nó cung cấp quyền kiểm soát hoàn toàn đối với tối ưu hóa. Khoản đầu tư đáng kể của công ty vượt quá 500 triệu đô la, cùng với mức lương cao thu hút tài năng hàng đầu của Trung Quốc (hơn 1,3 triệu đô la hàng năm cho một số nhà nghiên cứu), đóng góp đáng kể vào lợi thế cạnh tranh của nó.
Hình ảnh: Ensigame.com
Trong khi câu chuyện "thân thiện với ngân sách" của Deepseek được cho là tăng cao, thành công của nó nhấn mạnh tiềm năng của các công ty AI độc lập được tài trợ tốt. Sự tương phản rõ rệt về chi phí đào tạo-5 triệu đô la của Deepseek cho R1 so với 100 triệu đô la của R1 so với 4o-nhấn mạnh hiệu quả chi phí tương đối của Deepseek, ngay cả với khoản đầu tư thực tế đáng kể của nó. Tuy nhiên, câu chuyện thành công của công ty được quy cho chính xác hơn là đầu tư đáng kể, tiến bộ công nghệ và lực lượng lao động có tay nghề cao.