Openai suspeita que os modelos Deepseek AI da China, significativamente mais baratos que os colegas ocidentais, podem ter sido treinados usando dados do OpenAI, provocando controvérsia e turbulência do mercado. O surgimento da Deepseek causou um declínio acentuado nos preços das ações das principais empresas de IA, com a NVIDIA experimentando sua maior perda de um dia de todos os tempos.
O modelo R1 da Deepseek, baseado no Deepseek-V3 de código aberto, possui custos de treinamento significativamente mais baixos (estimados em US $ 6 milhões) e requisitos computacionais em comparação com modelos ocidentais como o ChatGPT. Embora essa alegação seja contestada, levantou preocupações sobre os enormes investimentos feitos pelas empresas de tecnologia americanas na IA. A popularidade de Deepseek surgiu nas paradas de download de aplicativos dos EUA, alimentados por discussões em torno de sua relação custo-benefício.
O OpenAI e a Microsoft estão investigando se Deepseek violou os termos de serviço da OpenAI, empregando "destilação", uma técnica para treinar modelos de IA usando dados extraídos de modelos maiores. A OpenAI confirmou sua conscientização sobre tais tentativas dos chineses e de outras empresas de replicar os principais modelos de IA dos EUA e declarou seu compromisso de proteger sua propriedade intelectual. David Sacks, o czar da AI do presidente Trump, corroborou a suspeita do Openai, sugerindo que as ações de Deepseek envolviam a destilação do conhecimento dos modelos Openai.
O OpenAI reconheceu anteriormente a impossibilidade de treinar grandes modelos de idiomas sem material protegido por direitos autorais, citando o amplo escopo da proteção de direitos autorais. Essa postura é enfatizada ainda mais por batalhas legais em andamento, incluindo uma ação judicial do New York Times, alegando uso ilegal de seu conteúdo e uma ação separada movida por 17 autores. Enquanto o OpenAI defende suas ações como "uso justo", esses processos destacam o cenário legal complexo e em evolução em torno do uso de material protegido por direitos autorais no treinamento de IA. A situação é ainda mais complicada por um escritório de direitos autorais dos EUA em 2018 que decidiu que a arte gerada pela IA não é elegível para proteção de direitos autorais.