Openai nghi ngờ rằng các mô hình AI Deepseek của Trung Quốc, rẻ hơn đáng kể so với các đối tác phương Tây, có thể đã được đào tạo bằng cách sử dụng dữ liệu Openai, gây tranh cãi và hỗn loạn thị trường. Sự xuất hiện của Deepseek đã gây ra sự sụt giảm mạnh về giá cổ phiếu của các công ty AI lớn, với NVIDIA trải qua tổn thất lớn nhất từ trước đến nay.
Mô hình R1 của Deepseek, dựa trên DeepSeek-V3 nguồn mở, tự hào có chi phí đào tạo thấp hơn đáng kể (ước tính khoảng 6 triệu đô la) và các yêu cầu tính toán so với các mô hình phương Tây như Chatgpt. Trong khi tuyên bố này đang bị tranh cãi, nó đã gây lo ngại về các khoản đầu tư lớn được thực hiện bởi các công ty công nghệ Mỹ trong AI. Sự phổ biến của Deepseek tăng lên trong các biểu đồ tải xuống ứng dụng của Hoa Kỳ, được thúc đẩy bởi các cuộc thảo luận xung quanh hiệu quả chi phí của nó.
Openai và Microsoft đang điều tra xem liệu Deepseek có vi phạm các điều khoản dịch vụ của Openai hay không bằng cách sử dụng "chưng cất", một kỹ thuật đào tạo các mô hình AI bằng cách sử dụng dữ liệu được trích xuất từ các mô hình lớn hơn. Openai đã xác nhận nhận thức về những nỗ lực như vậy của Trung Quốc và các công ty khác để tái tạo các mô hình AI hàng đầu của Hoa Kỳ và tuyên bố cam kết bảo vệ tài sản trí tuệ của mình. David Sacks, AI Czar của Tổng thống Trump, đã chứng thực sự nghi ngờ của Openai, cho rằng các hành động của Deepseek liên quan đến chưng cất kiến thức từ các mô hình Openai.
Openai trước đây đã thừa nhận sự bất khả thi của việc đào tạo các mô hình ngôn ngữ lớn mà không cần tài liệu có bản quyền, trích dẫn phạm vi bảo vệ bản quyền rộng rãi. Lập trường này được nhấn mạnh hơn nữa bởi các trận chiến pháp lý đang diễn ra, bao gồm một vụ kiện từ tờ Thời báo New York cáo buộc sử dụng bất hợp pháp nội dung của nó và một vụ kiện riêng biệt được đệ trình bởi 17 tác giả. Trong khi Openai bảo vệ hành động của mình là "sử dụng hợp lý", những vụ kiện này làm nổi bật cảnh quan hợp pháp và phát triển phức tạp xung quanh việc sử dụng tài liệu có bản quyền trong đào tạo AI. Tình hình còn phức tạp hơn bởi một văn phòng bản quyền năm 2018 của Hoa Kỳ phán quyết rằng nghệ thuật do AI tạo ra không đủ điều kiện để bảo vệ bản quyền.