
近日,據《連線》援引多位知情人訊息,OpenAI 研究員 Jason Wei 即將加盟 Meta 新成立的超級智慧實驗室。
據 Jason Wei 個人網站資訊,他曾參與 OpenAI 的 o3 模型及深度研究模型開發。2023 年加入 OpenAI 前,他曾在谷歌任職,期間專注于思維鏈研究 —— 這種研究的核心是逐步訓練 AI 模型處理複雜查詢。在 OpenAI 工作期間,Wei 曾坦言自己是強化學習的 “忠實擁躉”。強化學習是透過正反饋或負反饋來訓練、最佳化 AI 模型的技術,如今已成為 AI 研究的熱門領域,而 Meta 超級智慧團隊此前聘請的多位研究員,恰好都深耕這一方向。
另有訊息人士向《連線》雜誌透露,OpenAI 的另一位研究員 Hyung Won Chung 也將一同加入 Meta。多位訊息人士證實,兩人在 OpenAI 內部的 Slack 賬戶現已停用。目前,OpenAI、Meta 以及 Wei 和 Chung 本人都未回應《連線》雜誌的置評請求。
這些核心研究員的流動,無形中讓外界對 OpenAI 的團隊運作與文化底色愈發好奇:是什麼樣的環境,既孕育了頂尖人才,又讓他們在職業選擇上呈現不同走向?而近期另一位離職者的親身分享,恰好為我們提供了一個觀察這家公司內部生態的獨特視角。
曝光人 Calvin French-Owen 曾是客戶資料初創公司 Segment 的聯合創始人,該公司於 2020 年被 Twilio 以 32 億美元收購。
Owen 於 2024 年 5 月加入 OpenAI,曾參與了 Codex 的開發,三週前選擇離開。促使他寫下這篇文章的,並非要披露商業機密,而是希望趁著記憶清晰,像納比爾・庫雷希反思 Palantir 那樣,分享自己在 OpenAI 感受到的實際文化,為這個充滿魅力的組織留下一份個人視角的記錄,以回應外界圍繞其的諸多流言。
他坦言,離開 OpenAI 並非因個人恩怨,內心實則充滿矛盾。從創業者到大型公司員工的轉變本就不易,如今的他更渴望新的開始。同時,他也由衷認可 OpenAI 的工作價值 —— 能參與到通用人工智慧(AGI)、大語言模型這類重大技術創新中,親眼見證進展並參與 Codex 釋出,是他視為幸運的經歷。
在外界眼中,OpenAI 彷彿是一個高度集權、成員間協作無間且能攻克艱難任務的頂尖團隊。可真實的 OpenAI,更像是由眾多小團隊並行運作構成的叢集體系。這裡沒有統一的行動路線圖,各團隊的節奏也很少同步,執行的重要性遠勝過流程。研究方向並非由上層向下強行指派,而是透過激發研究員的興趣和挑戰欲,讓他們主動投身於問題的解決中。
就像 Codex 的釋出,僅用 7 周時間便完成,全憑一小群人奮力推動才得以上線。在他看來,OpenAI 身上留存著一種傳統的技術理想主義:以實現 AGI 為目標,即便出現錯誤也無妨,修正後繼續前進 —— 絕不會等到所有人都認同才啟動專案。
需要說明的是,文中觀點僅為作者的個人觀察,不代表這就是 OpenAI 的全貌,畢竟 OpenAI 規模龐大,這只是他所瞭解到的冰山一角。

Calvin French-Owen
我 2024 年 5 月加入 OpenAI,並在三週之前正式離開。
外界對於 OpenAI 的運作方式一直有很多流言蜚語,但很少提到跟真實工作文化相關的第一手資料。所以,這裡我想跟大家分享一點經歷回顧。
Nabeel Quereshi 寫過一篇題為《回顧 Palantir》(https://nabeelqu.substack.com/p/reflections-on-palantir)的精彩文章,其中回顧了 Palantir 的獨特之處。趁著自己對 OpenAI 的記憶還算清晰,我也想聊聊自己的體悟。放心,這裡不會涉及任何商業機密,有的只是對 OpenAI 這家人類歷史上最具魅力的組織之一的感受,以及它如何在一個充滿不確定性的時期發展和演變。
坦白講,我的離開並不摻雜任何個人因素——更準確地講,我其實非常糾結。從一位自主創業者轉變成公司內 3000 名員工中的一位,我經歷了很多掙扎。而現在,我渴望一個全新的開始。
首先想到的當然是我們做出的成果。哪怕不聊通用人工智慧(AGI)這樣可能顛覆一切的潛在成果,大語言模型也絕對是近十年來最偉大的技術創新。我很榮幸能親眼見證一切的發展,並參與到 Codex 的釋出中來。
再次重申,這些並不是 OpenAI 公司的官方看法,只是我個人管中窺豹的一點體會。這是一家規模龐大的組織,我能夠看到的永遠只是有限的切片。
要聊 OpenAI,肯定離不開它發展得有多快。我剛加入時,公司只有 1000 多人。但短短一年後,員工數量就超過了 3000 人,而我按任職年限排名位列前 30%。跟兩、三年前相比,幾乎所有領導層的工作內容都發生了翻天覆地的變化。
當然,快速擴張總會帶來新的挑戰:公司內部的溝通方式、彙報結構、產品交付思路、人員的管理和組織形式、招聘流程等等。不同團隊間的文化差異也很大:有些團隊一直在全力衝刺,有些則專注於踢好臨門一腳,還有些會以更穩定的節奏持續推進。OpenAI 就像一隻大鍋,把研究、應用和產品上市等諸多差異巨大的“食材”攪拌在一起。
OpenAI 最不同尋常之處,在於這裡的一切都執行在 Slack 之上。沒錯,我們不怎麼用電子郵件。在整個工作期間,我大概只收到過 10 封郵件。對於不善組織的人來說,這種溝通形式很容易造成混亂。但如果能管理好自己的頻道和通知,那一切也可以井井有條。
OpenAI 有著非常明確的自下而上特徵,在研究領域體現尤甚。剛剛入職時,我急著詢問下個季度的路線圖,而得到的答案是“沒有路線圖”(雖然現在有了)。好主意可能來自任何一個人,而且我們往往很難預先判斷哪些主意最有成效。OpenAI 並不會制定宏大的“總體規劃”,而是不斷迭代,且隨時匹配最新研究成果。
得益於這種自下而上的文化,OpenAI 也特別推崇任人唯賢。從歷史上看,企業領導者的晉升一直由他們提出好問題並付諸實踐的能力來決定。不少能力超群的領導者往往不擅長在全體會議上說服大家,或者展現巧妙的政治手腕。而在 OpenAI,這一切都不太重要、至少不像在其他公司那麼重要,最終勝出的就是最有質量的點子。
員工們更傾向於直接行動,職能相近但本不相關的各個團隊會在各個點子上匯聚又散開。我最終從事的是涉及 ChatGPT Connectors 的內部並行專案。在決定釋出專案之前,公司裡至少已經有 3、4 個不同的 Codex 原型在推進。很多工作往往由少數員工在未經許可的情況下就開始,在展現出潛力後再迅速圍繞他們組建完備的團隊。
Codex 專案負責人 Andrey 曾告訴我,我應該把研究人員視為一個個“迷你主管”。大家會傾向於專注自己認可的方向,再看看最終結果如何。由此可以推論:大多數研究都是由研究人員以學術方式探索特定問題的形式完成的。如果某個問題被認定為“意義不大”或者“已經解決”,那就到此為止、不再投入更多資源。
好的研究經理是決定成敗的關鍵,但能力仍非常有限。最優秀的研究經理能夠將多項不同研究工作聯絡起來,並整合出更大規模的模型訓練方案。優秀的產品經理同樣如此,我合作過的 ChatGPT 專案經理(Akshay、Rizzo、Sulamn)等是我接觸過的最酷的客戶。他們似乎無所不通、無所不曉,而且工作風格非常困難。他們關注的是吸納優秀的人才,確保為專案的成功做好充分準備。
OpenAI 也有非常敏捷的變向能力。這一點非常重要,畢竟現代組織的一大特徵,就是要根據新資訊快速轉向、而非僵化地依據原有計劃堅持舊路線。像 OpenAI 這樣體量龐大的企業居然還能保持這種精神,簡直令人驚歎——谷歌顯然失去了這種能力。OpenAI 決策迅速,而且在確定了方向之後就會全力以赴。
OpenAI 面對著巨大的審查壓力。對於擁有 B2B 從業背景的我來說,這其實相當難以理解。我常在媒體上看到一些內部都沒釋出過的神秘訊息。而在告訴別人我在 OpenAI 工作時,得到的反饋也往往是大家對這家公司先入為主的印象。不少 Twitter 使用者甚至會使用爬蟲程式,希望瞭解 OpenAI 有哪些新功能即將推出。
總之,OpenAI 是個外人眼中極其神秘的地方。恕我不能透露更多工作內容細節,但這裡有好幾個 Slack 工作區,對應的許可權也各不相同。至於公司收入和燒錢的具體數字,更是受到嚴格保密。
OpenAI 的運營態度也要比大家想象中嚴肅得多,部分原因在於這份業務風險很高。一方面,OpenAI 的目標是構建通用人工智慧(AGI),就是說很多事情必須得做好。另外,我們還得打造一款產品,確保數億使用者在無數場景和需求下都能正常使用。第三,這家公司站在全球最殘酷的競技場上,我們需要密切關注 Meta、谷歌和 Anthropic 的動向——相信他們也是一樣。而且不光是企業,全球各主要國家的政府也一刻都沒有放鬆對我們的審視。
儘管 OpenAI 常常在媒體上被黑,但就個人體會來講,這裡的每個人都在努力做正確的事情。只是 OpenAI 專注於消費者群體,也是大型研究機構中知名度的頂點,所以毀謗之詞總是如影隨行。
但千萬別誤會,OpenAI 可不是那種臃腫笨拙的大廠。在我眼中,OpenAI 更像是洛斯阿拉斯莫國家實驗室——最初由一群科學家和探索前沿科學的工程師組成。他們偶然間開發出了史上最火爆的消費者應用,之後又萌生了把產品推向政府和企業的雄心。這裡不同職位和不同部門的目標和觀點往往大相徑庭。在 OpenAI 待的時間越長,我們就越習慣從“研究實驗室”或者“公益性非營利組織”的視角看待問題。
最讓我欣賞的,是這家公司在推廣 AI 優勢方面的“言行一致”。前沿模型並不專屬於某些簽訂了年度協議的企業客戶。相反,世界上的任何人都可以訪問 ChatGPT 並獲取答案,哪怕不登入也行。ChatGPT 還提供 API,可供大家註冊並使用,且大多數模型(哪怕是最先進的模型或者專有模型)也會被很快收錄其中。可以想象,這是種與我們此前熟悉的商業邏輯完全不同的新形態,而且時至今日仍深深刻在 OpenAI 的 DNA 當中。
OpenAI 內部對於安全的重視程度遠超大家的想象。目前公司調排大量人員以開發安全系統。鑑於 OpenAI 的普適性質,公司也更關注實際風險(例如仇恨言論、虐待、操縱政治偏見、製造生物武器、自殘、提示詞注入等),而非理論風險(智力爆炸、權力壟斷等)。這並不是說沒人關注理論風險,只是優先順序相對低些。從個人角度講,我覺得很多安全努力沒有對外公開真的很遺憾,OpenAI 應該認真介紹自己到底為安全做了多少。
跟其他在每次招聘會上慷慨贈送禮包的公司不同,OpenAI 並不會搞太多實物福利。倒是有些“drops”活動允許員工優惠訂購庫存商品。第一屆 drops 活動就把 Shopify 給搞癱瘓了,因為需求量太大。當時有篇內部帖子還分享了經驗,介紹如何 POST 正確的 json 負載來規避這個問題。
OpenAI 最大的成本來源就是 GPU 算力,其他一切基本可以歸入誤差範疇。舉例來說,Codex 產品構建中涉及一項小眾功能,單是它的 GPU 成本就跟我們整個 Segment 基礎設施相當(規模雖然不如 ChatGPT,但佔用的網際網路流量非常誇張)。
OpenAI 也是我見過的最雄心勃勃、甚至令人感到敬畏的組織。很多人會覺得做出全球頂級消費者應用就夠了,但 OpenAI 渴望在數十個領域參與競爭:API 產品、深度研究、硬體、程式設計智慧體、影像生成乃至更多尚未公佈的領域。這是一片孕育創意並鼓勵付諸實踐的沃土。
公司還特別關注 Twitter。如果有人發了篇跟 OpenAI 的熱門帖,就會有專人跟進並認真對待。有個朋友開玩笑說,OpenAI 其實是靠網路輿論運轉的。作為一家消費者應用開發商,這話肯定有道理。雖然使用量、使用者增長和留存率分析也很重要,但 OpenAI 確實很關注社交平臺上的意見。
OpenAI 團隊成員的流動性也更大。在釋出 Codex 時,我們需要借調幾位經驗豐富的 ChatGPT 工程師來保證按時上線。我們跟好幾位專案經理溝通,並提出了這個請求。第二天,就有兩名經驗豐富的工程師前來支援。我們用不著等什麼季度換崗計劃或者人員調整通知,整個過程進展得非常迅速。
領導層也非常活躍,並且積極參與。在像 OpenAI 這樣的公司,各個響亮的名號都會在 Slack 上定期交流,從無一人缺席。
OpenAI 使用的是一個巨大的單體 monorepo,其中大部分是 Python 程式碼(但 Rust 服務的數量也在增加,網路代理用的則是 Golang)。因為 Python 的寫法很豐富,所以不少程式碼看起來奇奇怪怪的。比如為了規模化而設計的庫,包括谷歌十年老開發設計的庫,還有新晉博士生提交的一次性 Jupyter notebook。一切幾乎都圍繞著 FastAPI 來建立,並使用 Pydantic 進行驗證。在 OpenAI,並沒有任何強制性的風格要求。
OpenAI 的所有服務都執行在 Azure 上。但就個人體會,我覺得真正值得信賴的服務只有三項:Azure Kubernetes、CosmosDB(Azure 的文件儲存方案)和 BlobStore。目前我們還沒有大規模使用到 Dynamo、Spanner、Bigtable、Bigquery Kinesis 或者 Aurora。在自動伸縮單元中執行大量思考的情況相對少見,畢竟 IAM 的實現往往比 AWS 的限制要多得多。而且,內部實施往往也有很強的傾向性。
在工程人員方面,從 Meta 身上學習經驗非常重要。OpenAI 在很多方面都跟早期的 Meta 相似:推出了一款爆紅的消費級應用、採用新興基礎設施,也有著快速發展的願景。從 Meta 和 Instagram 那邊過來的多數基礎設施人才都非常優秀。
綜合考慮這些因素,會發現 OpenAI 的底層運作模式很大程度上沿襲了 Meta。比如在內部對 TAO 進行重新實施,藉此整合邊緣身份驗證。而且公司裡肯定還有我不瞭解的其他嘗試。
聊天這個形式成為很多工作的前提。自從 ChatGPT 出圈以來,很多程式碼庫都是圍繞聊天訊息和對話的概念構建出來的。這些原語目前已經非常成熟,但暫時忽略了其可能帶來的風險。我們在 Codex 中確實略微偏離了這個方向(更多借鑑了 responese API 的經驗),但也借鑑了不少現有技術。
程式碼至上。 決策通常由願意完成這項計劃的團隊提出,而非設立專門的中央架構或者規劃委員會。因此我們更傾向於直接行動,也導致程式碼中經常出現重複的部分。比如用於佇列管理或者智慧體迴圈的庫,我就見過至少五、六個。
但在某些領域,由於工具數量跟不上工程團隊的規模擴張,我們也遇到了新問題。sa-server(後端單體程式)幾乎成了垃圾場。主伺服器上 CI 中斷的頻率比大家想象中高得多,哪怕是並行執行的測試用例再加上一部分依賴項,在 GPU 上執行起來也需要差不多半個小時。這些問題雖然肯定有辦法解決,但也在隨時提醒我們,這類問題無處不在,而且隨著業務規模的快速提升只會變得愈發嚴重。但值得稱道的是,內部團隊投入了大量精力來改進這個問題。
有影響力的消費品牌是怎麼做出來的?直到參與 Codex 的開發,我才真正理解這一點。一切都要以“付費訂閱”來衡量。哪怕是像 Codex 這樣的產品,針對個人的使用者引導也要比說服團隊決策者更重要。這讓我有點傷腦筋,因為我之前做的都是 B2B/ 企業業務,只需要說服一個人,那專案從起步階段就能獲得流量。
大模型是怎麼訓練出來的(宏觀描述)。這是個從實驗到工程的過程,大多數想法先是用小規模實驗進行驗證。如果結果看起來有點希望,就會被納入更大規模的執行。實驗的範圍不僅包括調整核心演算法,還包括調整資料組合並認真研究結果。從宏觀角度來看,大規模執行本身就是一項龐大的分散式系統工程。肯定會出現一些奇怪的極端情況和意外問題,而除錯工作則完全落在我們自己身上。
怎麼用好 GPU 資源。在 Codex 釋出期間,我們先得預測負載能力需求,這也是我第一次真正投入時間對 GPU 進行效能測試。重要的是,應當從延遲要求(總體延遲、token 數量、首 token 時間)入手,而非自下而上地分析 GPU 承載能力。另外,每次模型迭代都會大大改變負載模式。
如何接手大型 Python 程式碼庫。Segment 是兩種微服務的結合,主要用到 Golang 和 TypeScript。我們的程式碼廣度肯定遠不及 OpenAI,因此在這裡學到了很多如何根據程式碼貢獻者數量來擴充套件程式碼庫的知識。簡單來講,必須要為“預設能跑”、“保持主程式碼庫清潔”和“不易濫用”等要求設定更多防護措施。
在 OpenAI 供職的最後三個月裡,我把很大一部分時間都花在了釋出 Codex 上。而這也成為我職業生涯中的最大亮點之一。
為了夯實基礎,OpenAI 早在 2024 年 11 月就明確提出,要在未來一年內釋出一款程式設計智慧體。到 2025 年 2 月,我們已經有一些內部工具開始執行,發掘大模型的程式設計潛力。但打造程式設計專用智慧體還是給我們帶來了巨大壓力,特別是如何保證其能夠真正為日常程式設計提供幫助(在此期間,市面上的氛圍程式設計工具迎來了爆發式增長)。
我提前結束了陪產假,趕回來參與 Codex 的釋出。一週之後,兩支內部團隊正式合併,開始了瘋狂衝刺。從編寫第一行程式碼到專案完成,整款產品僅用 7 周時間就成功落地。
Codex 衝刺可能是我最近十年來最辛苦的一段經歷。大多數情況下,我都得熬夜到夜裡 11 點甚至凌晨,而每天早上 5:30 就被小寶寶吵醒,7 點又要去辦公室。大多數週末得加班,團隊中的每個人都拼盡全力,因為每分每秒都至關重要。這讓我又想起了當初在 YC 打拼的時光。
實際進度也快得令人驚歎。我從未見過 OpenAI 這等規模的組織能夠在這麼短的時間內,把一個想法開發成一款全面上線且免費交付的產品。專案本身的體量也很可觀:我們構建了一個容器執行時、優化了程式碼庫下載、微調了一個處理程式碼編輯的自定義模型、處理了大量 Git 操作、引入了全新介面、實現了聯網查詢,最終打造出一款總體來說使用體驗極佳的產品。
無論外界怎麼評價,OpenAI 確實始終秉承著勇於創新的精神。
我們這支團隊有大約 8 名工程師、4 名研究員、2 名設計師、2 名產品上市專員和 1 名產品經理組成。如果沒有這樣的陣容,我想專案根本就不可能成功落地。對我們來說指導不重要,真正重要的是如何高效協同。我可以負責任地講,Codex 團隊的每位成員都非常出色。
釋出前一晚,我們五個人熬夜到凌晨 4 點,努力部署主 monolith(耗費好幾個小時)。之後我們回到辦公室,參加早上 8 點的釋出公告和直播。我們開啟 flag,看到流量開始湧入。我從未見過一款產品僅僅是顯示在左側邊欄裡就能獲得這等恐怖的流量增長,而這就是 ChatGPT 的魅力所在。
在產品形態方面,我們最終選擇了純非同步方案。與當時的 Cursor 和 Claude Code 等工具不同,我們的目標是允許使用者啟動任務,並讓智慧體在自己的環境中執行。我們希望終端使用者能像對待同事那樣對待程式設計智慧體:可以向智慧體傳送訊息,由智慧體花點時間完成工作,之後再返回 PR。
但整個過程有點像賭博:模型雖然表現不錯,但遠非完美。它們可以連著好幾分鐘不出錯,但卻堅持不了幾個小時。另外使用者對模型功能的信任度也參差不齊,我們甚至不清楚這些模型到底能實現哪些功能。
從長遠來看,我認為大多數程式設計工具都會朝 Codex 的形態發展,我也會對這類產品的後續推進保持關注。
Codex 還特別擅長處理大型程式碼庫,知道如何駕馭體量可觀的資產。跟其他同類工具相比,Codex 最大的亮點在於能夠同時啟動多個任務,並比較它們的輸出結果。
最近我看到一組公開資料,比較了不同大模型智慧體提交的 PR。單從結果上看,Codex 生成了 63 萬條 PR。就是說從釋出以來的 53 天內,每位參與開發的工程師對應約 7.8 萬條公開 PR。可以說,我這輩子從沒做過這麼有影響力的事情。
平心而論,我當初曾對加入 OpenAI 感到忐忑。我不確定放棄自由、犧牲主導權、成為一臺龐大機器中的小小零件是種什麼感覺。所以我悄悄入職,打算在發現不合適時隨時撤離。
而這段經歷也教會了我三樣東西……
-
建立對模型訓練方式和能力發展方向的直覺;
-
與優秀的人們共事並向其學習;
-
推出一款優秀的產品。
回顧過去一年,我認為加入 OpenAI 是我人生中最明智的決定之一。很難想象還有哪裡能像在 OpenAI 這樣教會我更多。
對於各位創始人,如果大家感覺自己的初創公司已經停滯不前,我的建議是:1)深刻地自我審視和評估,才能取得更多突破;2)加入某個大型實驗室。當下確實是創業的絕佳時機,但也是展望未來、找尋方向的絕佳時機。
在我看來,朝著 AGI 的衝刺賽場目前是三足鼎立之勢:OpenAI、Anthropic 和谷歌。三家各自立足獨特優勢(消費者、企業、以及堅如磐石的基礎設施 + 資料)選擇了不同的發展路徑。6 能夠參與其中任何一家,都將是段令人大開眼界的奇妙旅程。
原文連結:
https://calv.info/openai-reflections
宣告:本文為 AI 前線翻譯整理,不代表平臺觀點,未經許可禁止轉載。
首屆 AICon 全球人工智慧開發與應用大會(深圳站)將於 8 月 22-23 日正式舉行!本次大會以 “探索 AI 應用邊界” 為主題,聚焦 Agent、多模態、AI 產品設計等熱門方向,圍繞企業如何透過大模型降低成本、提升經營效率的實際應用案例,邀請來自頭部企業、大廠以及明星創業公司的專家,帶來一線的大模型實踐經驗和前沿洞察。一起探索 AI 應用的更多可能,發掘 AI 驅動業務增長的新路徑!

今日薦文

你也「在看」嗎?👇