OpenAICFO重磅曝料:AGI近在咫尺,全球最強程式設計智慧體已就緒!


新智元報道  

編輯:Aeneas KingHZ
【新智元導讀】OpenAI首席財務官Sarah Friar探討了通往AGI的發展路徑,目前OpenAI已到達第三階段:智慧體(Agnent)。除Opeator和深度研究Deep Research智慧體外,OpenAI即將釋出全球最強程式設計智慧體。
OpenAI,正引領生成式AI的革命浪潮。
這家公司如何確立行業領先地位?又採取了哪些策略保持競爭優勢?
2025年3月5日,在倫敦舉行的「高盛顛覆性科技峰會」中,OpenAI首席財務官Sarah Friar探討了通往AGI的發展路徑,以及資本在AI競賽中的關鍵作用。
Sarah Friar曾任高盛科技股權研究主管,會議中與高盛全球銀行與市場部聯席主Dan Dees展開深度對話,時長30餘分鐘。
她表示:「我們可能已經接近了AGI,但世界尚未學會如何最大化地利用它」。
OpenAI,正在全速前進,全面出擊:從資料中心到應用層,各部分都在創新。
左:高盛全球銀行與市場部聯席主Dan Dees先生,右:OpenAI首席財務官Sarah Friar女士

AI湧起,適逢其會
AI風起雲湧,而OpenAI銳不可當,可以說是目前最具影響力的技術領域中最具影響力的公司。
在去年OpenAI向她丟擲橄欖枝時,Sarah Friar實在很難拒絕。
去年6月10日,Sarah Friar加入OpenAI擔任首席財務官
在她看來, AI浪潮,確實比迄今為止看到的其他科技浪潮都要宏大,雖然她錯過了個人電腦革命。
加入OpenAI,投身AI科技浪潮,她覺得是個人難得的機遇和幸運。
但在網際網路崛起時,Sarah Friar在斯坦福商學院進修——2000屆畢業生都記得,那時網際網路泡沫正膨脹。
網際網路泡沫,也稱dot-com泡沫或dot-com熱潮在上世紀90年代末期並最終於2000年3月10日達到頂峰的一次股市泡沫。從1995年至2000年3月的高峰期,投資於NASDAQ綜合指數的資金增長了800%,而在2002年10月之前,該指數又從其峰值下跌了78%,回吐了泡沫期間的所有漲幅
隨後她又目睹了持續幾年的矽谷寒冬。
接著是移動網際網路的興起如何重塑企業,後來我在高盛的事業軌跡,坦白說也正是圍繞著向雲計算的轉型展開。
而如今站在浪潮的另一端,從宏觀世界格局到政府政策,再到企業級應用,全方位探討AI的影響——這種角色轉換令她無比振奮。
而最近,OpenAI關注的焦點是AI基礎設施。
這感覺就像是「雲計算黎明」再次來臨,儘管AI的架構和構建方式完全不同。
對親身經歷過「雲計算黎明」的人來說,這波AI浪潮更加迷人。

OpenAI如何用ChatGPT賦能工作
Sarah Friar認為當今世界上沒有哪位CEO或企業領袖會意識不到AI部署的緊迫性,甚至都擔心自己已經落後了。
作為OpenAI的CFO,她剛加入時最迫切的需求就是:「先要弄明白——我的團隊,就拿財務部門來說,到底該如何運用ChatGPT?」
但當時的情況是,由於OpenAI正在大規模招聘,許多員工來自尚未應用AI的傳統企業。
這導致團隊在AI應用方面出現了明顯的認知斷層——
大家對「誰來做什麼、為什麼做」缺乏統一理解,整體協作也缺乏組織性。
作為團隊管理者,她採取的第一個舉措就是親自組織了一場駭客馬拉松:召集銷售團隊和解決方案工程師,花了一下午進行討論。
從最基礎的環節開始, 用紙筆羅列出日常工作中那些高度重複性的任務。
隨後將人員按職能分組——稅務團隊一組、採購團隊一組、投資者關係團隊一組,透過小組討論,讓初步的想法碰撞。
即便採用如此簡單的方式,現場已經迸發出驚人的熱情。
她記得,當時投資者關係團隊正在籌備一輪大規模融資,深陷盡職調查「地獄」。
OpenAI很快發現,那些源源不斷的盡調問題雖然細節各異,但核心模式高度重複。
當時他們經常加班到深夜,反覆經歷這樣的場景:「啊,這位投資人問過類似問題——快找出之前的回覆,稍作修改再發出去。」
直到開發出能自動回答這些問題的定製GPT解決方案時,整個團隊在會議室裡簡直高興得手舞足蹈、歡呼雀躍。
這讓她深刻意識到:必須讓團隊成員從第一性原理出發,真正理解AI帶來的普適性效能提升。
而ChatGPT的深度研究,已經幫助OpenAI解決了關於GPU融資的分析問題。
她的團隊使用了深度研究,獲取了一份報告,得到了OpenAI內部員工的認可:「和兩位MD、三位VP、六位助理和十位分析師的團隊,DeepResearch所做的事情要好得多。」

GPT-3到GPT-4
從GPT-3過渡到GPT-4,OpenAI花了大約一年半到兩年的時間。
去年,他們首次部署了推理功能,也就是o系列模型。
這意味著從一個更傾向於預測、快速響應的即時回答模型,轉變成了能夠更像人類一樣推理的模型。
有一種簡單的描述方式是這樣的:
如果想象一下你做填字遊戲的時候,比如一個橫向的單詞有五個字母,你認為可能是三個不同的詞之一。
你填寫了一個單詞,然後轉向下一個豎向的線索,發現不對勁,第二個字母應該是A。
這就意味著之前的那個答案是錯誤的,你需要劃掉並重新填入另一個詞。
所以它會自我回溯。
這一點對於AI智慧體非常重要。
但如今,OpenAI遠遠不止這些。

AI基礎設施 2.0:AI工廠
OpenAI正深入資料中心,因為他們認為現在正處於AI基礎設施的第二版本(V2),或者如黃仁勳所稱的「AI工廠」。
資料中心創造了很多智慧財產權(IP),對OpenAI來說擁有這些IP非常重要。
想象一下亞馬遜在電子商務領域取得巨大成功時的情景。他們看到AWS(亞馬遜網路服務)開始成形。
就像在這個階段,如果他們決定將這一部分外包給新興的谷歌或其他公司,那會是怎樣的情形呢?如果當初亞馬遜將AWS的所有智慧財產權都拱手讓人,那麼今天這家公司將會是怎樣的不同呢?
如今,AWS在雲計算市場中佔據了40%的市場份額,並擁有38%的運營利潤率。
因此,擁有基礎設施能力非常驚人。
但現在OpenAI不僅停留在模型層面,還向上擴充套件到了API層,這使OpenAI將影響力擴充套件到企業和開發者。
然後再上一個層次進入應用層面,即如何推動功能特性的發展,讓消費者在個人生活和工作中都喜歡得到的東西。
所以,現在在ChatGPT的前端頁面,使用者可以用Sora生成影片,可以進行深度研究報告,可以搜尋,可以建立專案,可以編寫程式碼,還可以建立寫作畫布。
OpenAI的目標就是不斷載入這些功能。
然後她意識到,「ChatGPT已經有很強的使用者粘性了。我不打算離開它。」
從商業角度來看,這是件好事。這就是OpenAI目前所處的位置。
接下來,她介紹了OpenAI實現通用人工智慧(AGI)的五個步驟。

通向AGI的5個階段
2023年,是即時預測響應之年:聊天機器人Chatbot興起。
2024年,OpenAI把推理帶上了檯面。
2025年,將是AI智慧體的一年。
OpenAI實現通用人工智慧(AGI)的五個步驟
大概從去年第三季度或第四季度,OpenAI開始討論這個話題。
現在,Agent已經成為整個AI行業公認的術語。
但這裡的AI指的是能夠獨立為你完成工作的智慧體(agents)。
這不是虛無縹緲的概念。
實際上,OpenAI已經有三項功能在執行:
  1. 深度研究(Deep Research):這是一個生成深入的研究報告的工具。
  2. 操作員(Operator):允許任務工作者在網路上執行一些可能需要後臺處理時間的任務。
  3. 第三個即將推出的功能稱之為A-SWE(Agentic Software Engineer)。
A-SWE不僅僅是像Copilot那樣,增強現有軟體工程師的工作能力,而是一個真正能夠構建應用程式的自主軟體工程師。
它可以接受需求,並去實現它。但不僅僅是開發,它還做了所有軟體工程師討厭去做的事情。
它可以從你給任何其他工程師的Pull Request(PR)開始,去構建應用程式。
不僅如此,它還會完成所有軟體工程師討厭去做的事情:
它自己做程式碼質量保證、錯誤測試和除錯。
並且它還編寫文件。
這些都是所有軟體工程師不願意去做的任務。
因此,它可以成倍地提高軟體工程團隊的效率。
之後是AGI的第四階段:創新的世界。
在創新的世界,不再只是關於當今世界存在的知識,而是如何擴充套件這些知識。
實際上,從教授和學者那裡聽到的是,他們發現模型在專業領域中,提出了新的想法。
目前這些想法還需驗證,但OpenAI千真萬確地收到了這樣的反饋。
長遠來看,代理組織(agentic organizations)將是未來的發展方向。

AGI近在咫尺
OpenAI仍然有迄今為止最領先的模型:o3。
從軟體工程領域中,o3競賽性程式設計的表現:在全球排名第175位的競賽性程式設計師。
在數學競賽中,它只錯了一道題。
而在博士級別的科學領域,它在物理、化學、生物學等方面都達到了博士水平。
4個被廣泛認可的基準測試,用來衡量AI是否正在向AGI(通用人工智慧)邁進,即是否真正達到了人類智慧甚至超越了人類智慧的水平
OpenAI的產品團隊認為,o3 mini已經成為了全球最具競爭力的程式設計師。
在Sarah Fryer看來,如今已經非常接近AGI了。
也就是說,AI系統能夠承擔世界上大多數真正有價值的、人類的工作。
但可以肯定地說,作為一個世界共同體,我們還並未充分發揮它的潛力。
如今,有3個scaling law正在發生。
一個是預訓練,也就是讓通用模型變得更聰明。這就需要更多的資料和更先進的演算法專業知識。在更多算力的支援下,研究人員可以發揮更大的作用。
這就意味著,要想成功,就必須投入大量的資金。
在GPT-3、GPT-4、GPT-5這樣的大模型上,計算規模就在呈對數增長。
然後,就進入了後訓練階段。
比如我們想建立一個需要診病的模型,就需要對它微調,讓它專注於醫學。
而第三個階段——推理時計算,就是讓這輛「汽車」能切換到運動模式的時刻。
此時,需要在真正的賽道上行駛,從四驅模式切換到運動模式。
以上,就是關於擴充套件性的三條定律。
OpenAI的研究者,已經推出了「強化微調」技術。
他們發現,其實並不需要很多資訊,就能讓模型在一個特定領域展現出顯著的效能提升。
但關鍵在於,我們能否達到那個具體的領域?如果你想研究神經疾病,比如退行性疾病的結果,你能在這個特定領域獲得足夠的資訊嗎?
即使是一點點的資訊,也會極大提升模型的實用性。

星際之門,為什麼需要5000億
按照OpenAI的說法,星際之門需要投資5000億美元在計算能力上,或者說,它需要10吉瓦的算力。
這個數字是怎麼得出來的?
奧特曼在白宮參與5000億美元的Stargate計劃釋出會
這是透過預訓練擴充套件、後訓練擴充套件和推理時擴充套件這三個scaling law。
在模型開發的每個階段,都會需要越來越多的算力。
可以說,OpenAI沒有推出某些模型,就是因為沒有足夠的計算資源。
Sarah Friar表示,自己是個糟糕的CFO。
Sora差不多在前年2月或3月就準備好了,但直到差不多去年12月,OpenAI才真正推出了它。
甚至到現在,Sora也還沒有完全上線。
OpenAI選擇的,是推出深度研究,因為他們知道商業界非常喜歡這個特性。
因為沒有足夠的算力投入業務,Sarah Friar承認,自己每天做出最糟糕的決定,就是不給研究者提供最有價值的資源——研究所需的算力。
她甚至透露:很多時候,Sam Altman來上班時就會生她的氣,因為她沒有提供足夠的算力。
為什麼她會陷入這種境地?
因為在兩三年前,那些拍板決定算力決策的人,根本想象不到如今算力需求的增長會如此之快。
兩年時間裡,OpenAI的周活使用者就達到了4億,收入每年都翻了三倍。
現在,整個愛爾蘭的負載是7吉瓦,整個國家的使用量都比OpenAI需要的10吉瓦少。
而在她看來,在三年後當人們回過頭來,會覺得這時的人們對5000億這個數字神經緊張,簡直是大驚小怪。
所以,該如何擴大規模?電力來源於哪裡?是否需要培養人力?
事實證明,電工、暖通空調人員等,都是真正能夠制約建設的資源。
因此,美國政府也會對星際之門特別感興趣,因為它既是一種財政投資,也是有助於在經濟上保持領先地位。
而DeepSeek也讓人看到,AI正處於激烈競爭中。
OpenAI目前的關注點在於算力、研究人員、資料。
他們需要尋找地點和電力,他們需要平整地面,建設資料中心,填充裝置,購買GPU。
OpenAI需要真正證明:它有能力成功應對挑戰。
參考資料:
https://www.goldmansachs.com/insights/goldman-sachs-talks/openai-cfo-sarah-friar-on-the-race-to-build-artificial-general-intelligence


相關文章