速遞|OpenAI的最新模型疑似複製Deepseek原始碼後倉促上線,o3-mini推理過程竟是中文

圖片來源:Unsplash
OpenAI 於上週五推出了新的推理模型 o3-mini,這是該公司o系列推理模型中的最新模型。
然而在OpenAI推出o3-mini模型後不久,許多網友和開發者發現o3-mini的推理過程使用的居然是中文。有網友推測 OpenAl 可能複製了 Deepseek 的開原始碼和資料,在沒有仔細編輯的情況下著急釋出了 03-mini。在DeepSeek席捲全網後,OpenAI急於找回市場的信心。
圖片來源:X
ZF編輯部也實際測試了o3-mini的效果,發現模型在推理過程中確實使用了中文,而後在正式回答中又切回了英文。

這也不是OpenAI的推理模型第一次玩語言遊戲。根據TechCrunch報道,在 OpenAI 釋出其首個推理模型 o1 後不久,人們注意到一種奇怪的現象。該模型有時會在回答問題時“用中文、波斯語或其他語言思考”——即便問題是用英文提出的。
當被要求解決某個問題時,比如“strawberry 這個單詞裡有幾個 R?”o1 會啟動其“思考”過程,透過一系列推理步驟得出答案。如果問題是用英文寫的,o1 的最終答案也會是英文,但在得出結論之前,它可能會在某些步驟中切換到另一種語言。
AI 專家對此也沒有定論,但他們提出了一些理論。
X 上的一些人,包括 Hugging Face 的執行長 Clément Delangue,提到了像 o1 這樣的推理模型會在包含大量中文字元的資料集上進行訓練。谷歌 DeepMind 的研究員 Ted Xiao 聲稱,包括 OpenAI 在內的公司會使用第三方中文資料標註服務,而 o1 切換到中文正是“中文語言對推理的影響”的一個例子。
“[像] OpenAI 和 Anthropic 這樣的實驗室會利用[第三方]資料標註服務來處理科學、數學和程式設計的博士級推理資料,”Xiao 在 X 上發帖寫道,“由於專家勞動力的可用性和成本原因,這些資料提供商中有許多位於中國。”
標註(也稱為標籤或註釋)幫助模型在訓練過程中理解和解釋資料。例如,用於訓練影像識別模型的標註可能是圍繞物件的標記或指向每個人、地點或物體的標題。
然而,也有一些專家並不認同 o1 的中文資料標註假說。他們指出,o1 在推導解決方案時同樣可能切換到印地語、泰語或其他語言,而不僅僅是中文。
這些專家認為,o1 和其他推理模型可能只是選擇了它們認為最有效實現目標的語言(或者出現了“幻覺”)。
參考資料:
[1] OpenAI’s AI reasoning model ‘thinks’ in Chinese sometimes and no one really knows why, https://techcrunch.com/2025/01/14/openais-ai-reasoning-model-thinks-in-chinese-sometimes-and-no-one-really-knows-why/
歡迎掃碼加群參與討論
———END——–
我們相信認知能夠跨越階層,
致力於為年輕人提供高質量的科技、資本和商業內容。
青投創新,新型科創產業服務平臺,以科技、人才、資本為核心,透過內容出版、資料支援、產業諮詢、科技轉化等業務,為科技人才創業專案提供孵化及加速賦能服務,助力國家科技興國計劃。

相關文章