AIの疑い：Deepseekの迅速な精査の下で

Openaiは、中国のDeepseek AIモデルは、西部のカウンターパートよりも大幅に安価であり、Openaiデータを使用して訓練された可能性があると疑っています。 Deepseekの出現により、主要企業の株価が急激に低下し、Nvidiaが史上最大の1日の損失を経験しています。

Open-Source Deepseek-V3に基づくDeepseekのR1モデルは、ChatGPTのような西部モデルと比較して、トレーニングコスト（推定600万ドル)および計算要件を大幅に削減しています。この主張は議論されていますが、AIのアメリカのハイテク企業が行った大規模な投資について懸念を提起しています。 Deepseekの人気は、米国のアプリのダウンロードチャートで急増し、費用対効果をめぐる議論に支えられました。

OpenaiとMicrosoftは、Deepseekが、より大きなモデルから抽出されたデータを使用してAIモデルを訓練する手法である「蒸留」を採用することにより、Openaiのサービス条件に違反したかどうかを調査しています。 Openaiは、主要な米国AIモデルを再現しようとする中国および他の企業によるそのような試みに対する認識を確認し、知的財産を保護するというコミットメントを述べました。トランプ大統領のAI Czar大統領であるDavid Sacksは、Openaiの疑いを裏付けており、Deepseekの行動にはOpenaiモデルからの知識の蒸留が含まれていることを示唆しています。

DeepSeekは、OpenAIのモデルを使用して蒸留を使用して競合他社を訓練したと非難されています。画像クレジット：ゲッティイメージズを介してアンドレイルダコフ/ブルームバーグ。

この状況は、ChatGptのトレーニングにおける著作権で保護された資料の使用に関する独自の論争を考えると、Openaiの告発の皮肉を強調しています。批評家は、Openaiが膨大な量のインターネットデータに依存していることを指摘し、独自の倫理的慣行について疑問を投げかけています。

Openaiは以前、著作権保護の幅広い範囲を引用して、著作権で保護された素材なしで大規模な言語モデルをトレーニングすることが不可能であることを認めていました。このスタンスは、コンテンツの違法使用と17人の著者によって提起された別の訴訟を主張するThe New York Timesの訴訟など、進行中の法的戦闘によってさらに強調されています。 Openaiはその行動を「フェアユース」として擁護していますが、これらの訴訟は、AIトレーニングにおける著作権で保護された資料の使用を取り巻く複雑で進化する法的景観を強調しています。この状況は、2018年の米国の著作権局が、AIに生成された芸術は著作権保護の対象ではないと判決することにより、さらに複雑になっています。