速遞|OpenAI稱DeepSeek“盜竊”智慧財產權,或蒸餾了其模型來訓練R1模型

圖片來源:DeepSeek
根據金融時報報道,OpenAI稱它發現 DeepSeek 使用了 OpenAI 的專有模型來訓練自己的開源模型的證據。
OpenAI 向金融時報透露,它掌握了一些關於“蒸餾”(distillation)技術的證據。蒸餾是一種開發者用來最佳化小型模型效能的方法,該技術透過使用更大、更強大模型的輸出,使得小型模型能夠在特定任務上以更低的成本取得類似的效果。
OpenAI 拒絕進一步透露其證據的細節。該公司的服務條款規定,使用者不得“複製”其任何服務,也不得“利用輸出資料來開發與 OpenAI 競爭的模型”。
DeepSeek 推出的 R1 推理模型因其在認知任務上的卓越表現,讓市場、投資者和矽谷科技公司感到意外。其模型在多個排行榜上取得了較高排名,表現可與領先的美國模型媲美。
一位接近 OpenAI 的人士表示,蒸餾在行業內是一種常見做法,並指出 OpenAI 提供了一種官方途徑,讓開發者在其平臺上進行類似操作。但該人士補充道:“問題在於,當你利用它來建立自己的模型並用於自身目的時,就會存在爭議。”
據另一位知情人士透露,微軟和 OpenAI 在去年秋天對一些被認為屬於 DeepSeek 的賬戶展開調查,這些賬戶曾使用 OpenAI 的應用程式介面(API),並因涉嫌違反服務條款的蒸餾行為而被封禁。
此前,美國前總統特朗普的人工智慧與加密貨幣顧問大衛·薩克斯(David Sacks)表示,“有可能”發生了智慧財產權盜竊行為。薩克斯在週二接受福克斯新聞採訪時表示:“在 AI 領域有一種技術叫蒸餾……一個模型可以從另一個模型學習,並且在一定程度上吸取‘母模型’的知識。
“有大量證據表明,DeepSeek 的確透過蒸餾技術吸收了 OpenAI 模型的知識,我認為 OpenAI 對此並不高興。”薩克斯補充道,但他未提供具體證據。
DeepSeek 方面表示,其 V3 模型(擁有 6710 億引數)僅使用了 2,048 張 Nvidia H800 顯示卡,花費 560 萬美元進行訓練,而 OpenAI 和谷歌在訓練同等規模模型時的成本遠遠高於這一數值。一些專家指出,DeepSeek 生成的部分回答表明,它可能曾基於 OpenAI 的 GPT-4 輸出進行訓練,這將違反 OpenAI 的服務條款。
業內人士表示,實際上,無論是在中國還是在美國,AI 實驗室普遍會使用 OpenAI 等領先公司的輸出資料進行訓練。
OpenAI 等行業巨頭投入大量資源,僱傭人員教導其模型如何生成更具人類自然表達的回答,這一過程既昂貴又費時。因此,業內人士認為,較小的 AI 公司利用這些資料來改進自己的模型是一種常見做法。
加州大學伯克利分校人工智慧博士生 Ritwik Gupta 解釋道:“初創公司和學術機構使用像 ChatGPT 這樣具有人類反饋最佳化的商業 LLM(大型語言模型)輸出資料來訓練自己的模型,是一種非常普遍的做法。”
“這意味著他們可以免費獲得人類反饋最佳化的成果。我並不驚訝 DeepSeek 可能也在這樣做。如果確實如此,阻止這種做法可能會非常困難。”他補充道。
這一現象也暴露出前沿 AI 公司在尖端研究中的一個經濟難題——如何在其他團隊“搭便車”利用其模型的情況下,維護自身的技術領先地位。
與此同時,中國公司不僅迅速吸收了美國同行的經驗,還創新出最佳化有限算力資源的方式,從而降低了訓練和執行模型的成本。
OpenAI 在宣告中表示:“我們知道,其他公司一直在試圖蒸餾美國領先 AI 公司的模型。我們採取了一系列反制措施來保護我們的智慧財產權,包括謹慎選擇哪些前沿能力會被納入釋出模型。展望未來,我們認為,與美國政府密切合作以保護最先進模型免受對手和競爭者的竊取至關重要。
與此同時,OpenAI 也正面臨自身的版權訴訟,包括《紐約時報》和多位知名作家在內的內容創作者指控 OpenAI 在未經授權的情況下,使用其文章和書籍訓練 AI 模型。
今年9月,中國的阿里巴巴釋出了100多款新開源AI模型,作為Qwen 2.5系列的一部分,支援29種語言。中國搜尋巨頭百度有Ernie系列,智譜AI有GLM系列,MiniMax則推出了MiniMax-01系列,這些模型在效能上與美國領先的模型相比具備顯著的競爭力,並且成本大大降低。
參考資料:
[1] OpenAI says it has evidence China’s DeepSeek used its model to train competitor, https://www.ft.com/content/a0dfedd1-5255-4fa9-8ccc-1fe01de87ea6
歡迎掃碼加群參與討論
———END——–
我們相信認知能夠跨越階層,
致力於為年輕人提供高質量的科技、資本和商業內容。
青投創新,新型科創產業服務平臺,以科技、人才、資本為核心,透過內容出版、資料支援、產業諮詢、科技轉化等業務,為科技人才創業專案提供孵化及加速賦能服務,助力國家科技興國計劃。

相關文章