Suspeita da AI: a subida rápida de Deepseek sob escrutínio

Openai suspeita que os modelos Deepseek AI da China, significativamente mais baratos que os colegas ocidentais, podem ter sido treinados usando dados do OpenAI, provocando controvérsia e turbulência do mercado. O surgimento da Deepseek causou um declínio acentuado nos preços das ações das principais empresas de IA, com a NVIDIA experimentando sua maior perda de um dia de todos os tempos.

O modelo R1 da Deepseek, baseado no Deepseek-V3 de código aberto, possui custos de treinamento significativamente mais baixos (estimados em US $ 6 milhões) e requisitos computacionais em comparação com modelos ocidentais como o ChatGPT. Embora essa alegação seja contestada, levantou preocupações sobre os enormes investimentos feitos pelas empresas de tecnologia americanas na IA. A popularidade de Deepseek surgiu nas paradas de download de aplicativos dos EUA, alimentados por discussões em torno de sua relação custo-benefício.

O OpenAI e a Microsoft estão investigando se Deepseek violou os termos de serviço da OpenAI, empregando "destilação", uma técnica para treinar modelos de IA usando dados extraídos de modelos maiores. A OpenAI confirmou sua conscientização sobre tais tentativas dos chineses e de outras empresas de replicar os principais modelos de IA dos EUA e declarou seu compromisso de proteger sua propriedade intelectual. David Sacks, o czar da AI do presidente Trump, corroborou a suspeita do Openai, sugerindo que as ações de Deepseek envolviam a destilação do conhecimento dos modelos Openai.

Deepseek é acusado de usar o modelo do OpenAI para treinar seu concorrente usando a destilação. Crédito da imagem: Andrey Rudakov/Bloomberg através de imagens Getty. Os críticos apontaram a dependência da OpenAI em vastas quantidades de dados da Internet, levantando questões sobre suas próprias práticas éticas.

O OpenAI reconheceu anteriormente a impossibilidade de treinar grandes modelos de idiomas sem material protegido por direitos autorais, citando o amplo escopo da proteção de direitos autorais. Essa postura é enfatizada ainda mais por batalhas legais em andamento, incluindo uma ação judicial do New York Times, alegando uso ilegal de seu conteúdo e uma ação separada movida por 17 autores. Enquanto o OpenAI defende suas ações como "uso justo", esses processos destacam o cenário legal complexo e em evolução em torno do uso de material protegido por direitos autorais no treinamento de IA. A situação é ainda mais complicada por um escritório de direitos autorais dos EUA em 2018 que decidiu que a arte gerada pela IA não é elegível para proteção de direitos autorais.