
線上閱讀:https://talk.gitee.com/report/china-open-source-2024-annual-report.pdf
昨天奧特曼在 X 上稱將發大招,然後 OpenAI 釋出了 o3-mini (看似沒有很大),他們隨即做了一個產品釋出活動。
然後奧特曼在 Reddit 上回答網友問題,有網友詢問能否考慮開放一些權重模型或者相關研究時,奧特曼稱:OpenAI 在開源問題上一直處於“歷史錯誤的一邊”。
所以我覺得,如果是大招的話,這個才是大家期待的大招!!!

下面是來自 TechCrunch 的報道(使用的是我正在開發的一個小軟體,基於 Gitee AI 提供的 Qwen7-7b 的模型 API 翻譯):
在結束一天的產品釋出活動後,OpenAI的研究員、工程師和高階管理人員,包括OpenAI執行長Sam Altman,於週五在Reddit上進行了廣泛的AMA(Ask Me Anything,即“問我任何問題”)活動。

OpenAI 公司目前正處在一個微妙的位置。它正在與人們認為它在人工智慧競賽中落後於像 DeepSeek 這樣的中國公司(關於 DeepSeek 的所有資訊)的看法作鬥爭,OpenAI 指控 DeepSeek 可能竊取了其智慧財產權。ChatGPT 的製造商一直在努力加強與華盛頓的關係,同時追求一個雄心勃勃的資料中心專案,據報道還在為歷史上最大的一輪融資之一奠定基礎。
Altman 承認 DeepSeek 減少了 OpenAI 在 AI 領域的領先優勢,他還表示,他認為 OpenAI 在開源其技術方面“站在了歷史的錯誤一邊”。雖然 OpenAI 之前曾開源過模型,但公司通常更傾向於專有、閉源的軟體開發方法。
“[我個人認為我們需要] 找出不同的開源策略,” Altman 說。“OpenAI 中的並非所有人都持有這種觀點,這也不是我們當前的最高優先順序 […] 我們將生產出更好的模型 [未來],但我們不會像過去幾年那樣保持那麼大的領先優勢。”
在隨後的回覆中,OpenAI 的首席產品官 Kevin Weil 表示,OpenAI 正在考慮開源那些不再是前沿技術的舊模型。“我們肯定會考慮做更多這樣的事情,” 他說,但沒有透露更多細節。
除了敦促OpenAI重新考慮其釋出理念之外,Altman 表示 DeepSeek 還推動公司可能更多地透露其所謂的推理模型,例如今天釋出的 o3-mini 模型,展示它們的“思考過程”。目前,OpenAI 的模型隱藏了它們的推理,這種策略旨在防止競爭對手刮取訓練資料用於自己的模型。相比之下,DeepSeek 的推理模型 R1 展示了其完整的思維鏈。
“Weil 補充說:“我們正在努力展示比今天更多的內容——[展示模型思考過程] 將會非常非常快。“關於所有這些——展示所有思維鏈會導致競爭蒸餾,但我們也知道人們(至少是高階使用者)想要它,所以我們會找到平衡它的正確方法。”

Altman 和 Weil 試圖消除有關 ChatGPT(OpenAI 透過該聊天應用推出許多模型的平臺)價格將會上漲的謠言。Altman 表示,如果可能的話,他希望隨著時間的推移讓 ChatGPT 變得更“便宜”。
Altman 此前曾表示,OpenAI 在其最昂貴的 ChatGPT 計劃 ChatGPT Pro 上虧損,該計劃每月費用為 200 美元。
在一條與之相關的帖子中,Weil 表示,OpenAI 繼續看到更多計算能力帶來“更好”和效能更強的模型的證據。這就是部分促使 Stargate 專案(OpenAI 最近宣佈的巨型資料中心專案)的原因,Weil 說。他還繼續表示,服務不斷增長的使用者群體也在 OpenAI 內部推動了計算需求。
關於這些強大模型可能帶來的遞迴自我改進,Altman 表示,他認為“快速起飛”的可能性比他之前認為的要大。遞迴自我改進是一個過程,其中人工智慧系統可以在沒有人類輸入的情況下提高自己的智慧和能力。
當然,值得注意的是,Altman 以過度承諾而聞名。不久前,他降低了 OpenAI 對 AGI 的期望。
一位 Reddit 使用者詢問 OpenAI 的模型,無論是否自我改進,是否會被用於開發破壞性武器——特別是核武器。本週,OpenAI 宣佈與美國政府合作,將它的模型提供給美國國家實驗室,部分原因是為了核防禦研究。
Weil 表示他信任美國政府。
“我已經認識了這些科學家,他們不僅是世界級的研究者,還是AI領域的專家,”他說。“他們瞭解這些模型的力量和侷限性,我認為他們不可能僅僅將某個模型輸出直接應用到核計算中。他們聰明、基於證據,並且進行了大量的實驗和資料工作來驗證他們所有的成果。”
OpenAI 團隊被問到了一些更技術性的問題,比如 OpenAI 的下一個推理模型 o3 將何時釋出(Altman 表示:“超過幾周,不到幾個月”),公司下一個旗艦“非推理”模型 GPT-5 可能何時落地(Altman 表示:“目前還沒有時間表”),以及 OpenAI 可能何時揭開 DALL-E 3 的繼任者的面紗,DALL-E 3 是公司推出的影像生成模型。
DALL-E 3 大約兩年前釋出,已經顯得有些過時了。自從 DALL-E 3 釋出以來,影像生成技術已經取得了飛躍性的進步,該模型在許多基準測試中已經不再具有競爭力(檢視詳情)。
關於 DALL-E 3 的後續產品,Weil 表示:“是的!我們正在開發它。我認為它將值得等待。”
