突發!DeepSeek被美國質疑「偷竊」,遭OpenAI微軟調查,論文曝突破英偉達護城河 2025-04-23 20:49 APPSO 春節期間,一場關於 DeepSeek 的風波正在 AI 圈掀起波瀾。 據彭博社最新報道,微軟安全研究人員在去年秋天發現,一些可能與 DeepSeek 相關的個人透過 OpenAI 的 API 大規模提取資料。 知情人士透露,作為 OpenAI 的技術合作夥伴和最大金主,微軟在發現這一情況後立即通知了 OpenAI。 報道稱,這種行為可能違反 OpenAI 的服務條款。因為 OpenAI 的服務條款明確規定,使用者不得未經授權使用自動化或程式化方法從其服務中提取資料。 即使 DeepSeek 獲得了某種形式的 API 訪問許可權,但如果其使用方式超出了 OpenAI 授權的範圍,比如用於非法或未經授權的商業目的,也可能被視為違反服務條款。 對於相關置評請求,OpenAI 未作回應,微軟拒絕評論,而 DeepSeek 方也暫未回應。 值得一提的是,此前許多外界人士認為透過模型蒸餾技術,DeepSeek可能在訓練過程中使用了 ChatGPT 等模型的輸出資料作為訓練材料,而這些資料中的「知識」被遷移到 DeepSeek 自己的模型中。 事實上,這種做法在 AI 領域並不罕見。 但質疑者關注的是 DeepSeek 是否在未充分披露的情況下使用了 OpenAI 模型的輸出資料。這似乎在 DeepSeek-V3 的自我認知上也有所體現。 早前就有使用者發現,當詢問模型的身份時,它會將自己誤認為是 GPT-4。 DeepSeek 團隊在最新模型 R1 的技術報告中明確表示未使用 OpenAI 模型的輸出資料,並表示透過強化學習和獨特的訓練策略實現了高效能。 例如,採用了多階段訓練方式,包括基礎模型訓練、強化學習(RL)訓練、微調等,這種多階段迴圈訓練方式有助於模型在不同階段吸收不同的知識和能力。 彭博社報道還指出,美國 AI 事務主管 David Sacks 近期在接受 Fox News 採訪時表示,有「確鑿證據」表明,DeepSeek 利用 OpenAI 模型的輸出資料來開發自身技術。 不過,Sacks 並未提供具體的證據。近期,美國多名官員也表示 DeepSeek有「偷竊」嫌疑,正對其影響開展國家安全調查。 針對 David Sacks 的言論,OpenAI 的回應則比較保守。其發言人表示「我們知道,來自中國的公司以及其他一些企業,始終在嘗試『蒸餾』美國領先 AI 公司的模型。」 該發言人強調,作為 AI 領域的領先者,OpenAI 已採取相應對策來保護其智慧財產權,其中包括對前沿能力的嚴格篩選,決定哪些功能可以公開發布。他們認為與美國政府密切合作對於保護最先進的 AI 模型至關重要。 就在這場爭議風波持續發酵之際,外媒的目光也開始轉向 DeepSeek 更早釋出的開源 V3 模型,後者則透過技術報告詳細披露了相關的深度底層最佳化細節。 據外媒扒出,V3 模型的開發甚至繞過了 CUDA,透過對英偉達 GPU 低階組合語言 PTX 進行最佳化,從而實現了最大效能。 PTX 是英偉達 GPU 的中間指令集架構,能夠實現暫存器分配、執行緒 / 執行緒束級別調整等細粒度最佳化。如果說 CUDA 是與英偉達 GPU 對話的「高階語言」,那麼 PTX 就像是一種「機器底層語言」。 想象你在玩一個遊戲機。通常情況下,我們只需要用手柄(就像 CUDA)就能玩遊戲,這很方便,但可能無法發揮遊戲機的全部實力。 而 PTX 就像是打開了遊戲機的後蓋,直接調整裡面的各種配件和線路。雖然這樣做很複雜,需要懂得很多專業知識,但是可以讓遊戲機跑得更快、效能更好。 更通俗的解釋是,PTX 就是一種能夠讓開發者「掀開 GPU 的蓋子」,直接調教其內部運作方式的工具。這就像是改裝汽車,不是簡單地踩油門,而是直接調教發動機的每個零件,以榨取最大效能。 DeepSeek 在訓練 V3 模型時,對 H800 GPU 進行了重新配置,包括劃分出 20 個 SM 用於伺服器間通訊,以及實現了流水線演算法,最佳化能力遠超常規 CUDA 開發水平。而倘若這一技術屬實,或將撼動英偉達構築已久的護城河。 圖片截圖來自 DeepSeek v3 技術報告 不過,PTX 雖然能極大地最佳化效能,但也對開發團隊提出了更高的要求。相比之下,英偉達的護城河 CUDA 憑藉其開發便捷性和快速迭代的優勢,仍然是大多數開發者的首選。 更重要的是,PTX 最佳化往往需要針對特定型號的硬體進行定製。 這種「量體裁衣」式的最佳化策略雖然效果顯著,但也大大增加了開發難度和維護成本。這也解釋了為什麼在可預見的未來,CUDA 仍將在主流開發中佔據主導地位。 但在既有規則之外尋求突破,往往就是顛覆的開始,DeepSeek 這次在海內外掀起的技術浪潮或將有望撬動整個 AI 產業鏈的既有秩序。