OpenAI急了?我們應該抓住哪些變數?

在過去的一個月,OpenAI連續推出12場重磅釋出會:
Day 1:滿血o1上線,ChatGPT Pro會員上線,o1 pro推出,AI有了類人“思考”能力。
Day 2:基於o1的強化微調,人人都能訓練專家模型,專業門檻直線下降。
Day 3:Sora正式釋出,AI開始“看懂”現實世界。
Day 4:ChatGPT Canvas全員開放以及小功能更新,寫文章、寫程式碼一氣呵成。
Day 5:全面接入蘋果生態,打造更自然的多裝置跨平臺操作體驗。
Day 6:4o的即時影片理解上線,多模態讓AI看懂影片內容。
Day 7:ChatGPT上線 “Projects專案”功能。
Day 8:ChatGPT Search全量開放,升級AI搜尋功能,挑戰傳統網路搜尋。
Day 9:滿血o1 API正式開放,大幅降低API呼叫價格。
Day 10:從最新款的iPhone到老式的翻蓋機,能直接和ChatGPT打電話聊天了。
Day 11:應用升級,桌面版GPT可以跨應用互聯,告別繁瑣的複製貼上對話。
Day 12:OpenAI o3正式釋出,超級智慧模型震撼登場,向AGI又邁進了一大步。
每一天的釋出會都是振聾發聵的技術突破與產品創新,這些前所未有的技術加速度正在深刻改變全球的商業格局、產業生態以及個體的能力邊界。
AI將帶來哪些行業鉅變?
AI離取代人類又近了一步?
AI在哪些能力上已達到了人類的水平?
12月28日,混沌邀請到了矽谷知名華人AI科學家田淵棟博士,脈脈創始人兼CEO林凡,雲跡科技創始人、混沌學園校友支濤,雲九資本合夥人、混沌創新領教任鑫,混沌合夥人、混沌創新領教張雷等AI行業從業者、專家們一起解讀了OpenAI的這12場釋出會。這不僅是一場關於AI技術趨勢的分享,更是一場關於個人未來發展的思考。AI帶來的不僅是工具的進化,更是思維的迭代與格局的重塑。在2025即將到來之際,讓我們站在技術與人性的交匯點,重新審視未來的可能性。
以下為部分分享內容精華筆記:

田淵棟博士:OpenAI o3的表現依然驚豔
前段時間,OpenAI連續開 12 天的產品釋出會,內容大致包括增強的ChatGPT o1模型、Sora影片生成模型和o3模型。另外,還有一些技術上的突破,包括推理模型o1、強化微調技術、文生影片Sora、寫作和程式設計工具Canvas、與Apple生態系統的深度整合、語音和視覺功能、ChatGPT搜尋、打電話和WhatsApp聊天等功能。
總體來說,前11天沒有什麼太多的驚喜,第12天出現的o3相對具有一定的創新能力。它的能力主要表現為解決了之前的一些技術難題,我認為有三個值得一提的亮點:
1. 在ARC-AGI測試中o3的成績遠超其他模型。ARC-AGI測試就像是為人工智慧準備的一個特殊"考試"。它不是考AI背誦了多少知識,而是測試AI是否真的具備"理解力"和"思考力"。對目前的AI技術而言,一般的大模型在ARC-AGI測試中的成績大約都在25%-50%之間,而o3的最低成績為75.7%,最高成績為87.5%,有著巨大差距。
2. o3 在全球著名的編碼競賽平臺codeforces 中刷出 2727 分,達到此分數的程式設計師不到200人,之前2073分已相當於終極者,而o1是1891分。這意味著在競爭性程式碼方面,o3已經達到了世界頂尖程式設計師水平。
3. 今年11月o3在陶哲軒等60餘位全球數學家共同推出的號稱業界最強數學基準的EpochAI Frontier Math中創下新紀錄,準確率達到25.2%。而今天所有其他模型的準確率都低於2%。聯手60多位數學家出題的陶哲軒,曾認為這項測試能夠難住AI好多年。如今,這一說法被OpenAI o3推翻了。
可以看到,o3在各方面的表現都讓人驚豔,因此很多人判斷它會影響未來世界的樣態。

田淵棟博士:AI正在掀起一陣洪流
計算機普及以後,它的普遍性就像水一樣。反觀大模型,隨著它的不斷發展,也會出現同樣的情況。AI出現之前,創業的模式是找很多人組建一個團隊,團隊裡的每個人需要不斷地試煉和培訓才能成為一名有用之才,這一過程大約需要20年的時間。但如果AI變得非常便宜,創業者就可以以極低的成本獲得穩定性和樂此不疲的勞動力。到那個時候,市場會是什麼樣子難以想象,但對於創業者來說,成本和風險會降低很多。
AI的分析能力非常強大,因為它有一個巨大的資料庫。我用過一些AI工具,我感覺它們很像小鎮做題家,透過大量的訓練不斷地提升自身的能力,最終尋找到解題的方式。因此它的出現未必對所有人來說都是好事情,例如那些習慣用做題思維解決問題的人。因為AI的水平很大程度上可以取代一些重複性的勞動,做題思維可替代性很高。這告訴我們:不要以一種高考做題家的狀態去工作和生活,要保持思維的活力和創造力。這樣我們才可以儘量避免被AI淘汰。
AI到來之前,我們的世界佈滿了山峰,每個山峰上都站著行業裡最優秀的人。AI到來之後,它掀起了一陣洪流,讓一些山峰上的人被沖刷,以至掉落。留下來的人,只會是最具創造性、不可替代性的人,同時也是領域裡的專家。這大概會在十年內發生。

田淵棟博士:2025的活法,是讓AI來加速自己
我認為在2025年,AI會更快速地發展。加速到一定程度之後,每個人都會開始使用AI,以防止自己的效率遠低於其他人。如果這一猜想變成現實,人的價值感會受到影響。我的價值是什麼?人類獨一無二的價值是什麼?這是每個人都要面對的問題。
這個問題很難回答,但我們可以在行動中不斷地接近問題的答案,比如我願意透過寫小說找到一些存在的價值,這是我自我定位的一個錨點。AI的出現在提醒我們,人最終要找到自己的獨一無二之處,立足世界的生態位。在尋找的過程中,我們可以利用AI加速自己的發展,把AI集合起來,讓它們成為自己的將領,協助你做成想做的事。

脈脈林凡:OpenAI的發展遇到了瓶頸
從這次12天釋出會來看,OpenAI的發展受阻了。整個模型的核心能力沒有如預期一樣實現Scaling law增長,這其中的主要問題不是算力,而是資料。總體來看,現在所有的模型訓練基本上耗盡了高質量的資料,哪怕透過合成數據或其他方式來逼近都無法產生足夠的效應。
這是為什麼?首先,AI的聽覺能力目前無法增強;其次,視覺資料方面有太多的噪音(比如YouTube上的影片),海量資訊的雜糅,讓AI去理解世界、生成內容存在比較大的限制。
因此我們可以判斷,OpenAI遇到了瓶頸期。有一個很簡單的道理——如果核心能力足夠強,其實不用講太多的內容。正如此前的ChatGTP-4,只需要一場釋出會就足以震驚世界。而這次為期12天的釋出會卻沒有掀起之前那麼大的火花。對我們創業者來說,可以根據這次OpenAI的情況來計劃未來一兩年的創業路徑。一定要記住一件事:對於核心基座的能力,它的突破速度沒有那麼快。

脈脈林凡:o3大大提高了AI應用爆發的可能性
打一個比方,如果用高鐵來去形容AI的能力進展的話,GPT3.5相當於每小時120公里的火車速度一下提到了每小時200公里,速度翻了將近一倍,對於很多人來講,已經是一個很大的進步了。GPT4出來的時候,相當於每小時200公里提高到每小時350公里。那麼o3呢?相當於提升到了每小時450公里。對於做研究的同學來講,已經是很大的提升了。但是,作為一個普通消費者,一列350公里時速的高鐵和一列450公里時速的高鐵,對生活的影響就比較小了。為什麼?從3小時的旅程變成了2小時20分鐘的旅程,時長變化的體感並不強烈。
在技術上,不管是九月份釋出的o1,還是12月份釋出的o3,其實都是在Post-Train(後訓練)環節做出了比較大的突破,比如思維鏈的訓練、強化學習方面做了很多處理。很多跟我們一樣做過AI應用,尤其是To B的 AI應用的人會有一種體感,我們去做agent,去做工作流,其實是在OpenAI上面去打了一堆的業務補丁,業務的狀態機控制在頂層,然後透過頂層的狀態機去讓AI做1、2、3、4、5、6的事情。當然,這個過程很痛苦,因為有的時候它真的很不聽話,你要它這麼幹,它卻幹出了另外一件事情出來。
所以,現在OpenAI做的Post-Train這件事情,相當於把你上層的邏輯內化到了模型內部,做了內建,這樣就會降低後鏈路開發的難度和複雜度。在新的一年裡,AI應用開發的難度會降低,效率和大爆發的可能性會極大提高。這件事情我覺得是需要關注和重視的。

脈脈林凡:AI的創業機會不在To B,在To C
對於中國創業者而言,To B行業的 Agent開發或 workflow的最佳化都不是我們的機會。美國的To B生態非常發達,很多創業者做完workflow的最佳化後馬上就能賺到錢,但中國只適合大廠去做這件事,並且他們自己就能做,不需要找創業者。
在這種情況下,To C是創業者們唯一的機會。Realtime API是一種即時語音互動API,支援文字和音訊作為輸入和輸出,比我們原先用的TTS、ASR的效果好很多。在這個方面,Realtime API的出現會讓To C行業的互動產生鉅變。例如,面向兒童群體的即時語音互動應用肯定會很受歡迎。但當前還缺乏一種類似於Agent這樣的框架與之協同,因為僅依靠大模型的話準確度不高,需要一個可以控制的介質。一旦控制能力與即時語音互動能力結合在一起,會為整個To c行業的創業者帶來一次巨大的突破機會。

雲跡科技創始人支濤:AI已超越了工具,其能力好比擁有了大理段氏的“六脈神劍”
人類為了延伸體力和腦力製造了很多工具,比如火車、電腦、電動工具。這次OpenAI的釋出會也釋出了一系列我們夢寐以求的工具。在我看來,這些工具超越了“工具”的定義,變成了六脈神劍。它有自主力,學習力、互動力、適應力、情感力和社會力。按照目前的發展來看,AI已經是生產關係和生產力的重要組成部分。
看完釋出會以後,有沒有覺得AI像是一個正在現實世界不斷學習的學生呢。在回答我們問題的時候,是語文;在幫我們進行推理的時候,是數學和經濟學;在輔助我們工作的時候,是工程技術、生命科學和管理學。一旦它們試圖創新,則會逐個攻讀哲學、心理學,甚至是組織行為學。
AI這種矽基生物透過不斷地迭代,從開始的輔助工具,逐漸演變為人類身邊的助理,如果有一天,它們變成了智慧體,就會成為我們的夥伴。一旦它們開始洞察世界,找到人類還沒有發現的問題時,它們則化身為一個創新者的面貌出現在我們面前。
我們人類如何實現成長?對今天的我們來說,要先學習使用它們的方式,在它們的發展過程中掌握自身的領導力,最後建立一個“超級智慧的超個體意識”,與AI做到你中有我,我中有你。這其中要讓他們跟我們一樣,使命、願景、價值觀對齊;在社會里高度統一的法律、法規、道德形成一致。

雲跡科技創始人支濤:AI在To B的應用場景需要進一步開啟
重塑與AI的對話能力十分重要,因為這樣才能讓AI更好地為我們服務。中國企業在To C場景的推進較好,在To B的應用場景需要進一步開啟。To B裡,需要更多的人轉換思維模式,理解並用好AI來做職業增強,解決實際問題,創造價值。這也提醒了我們企業,不僅要給To C場景提供生產力,還要在ToB場景裡提供生產關係。未來,希望中國企業能夠快速發展,加大To B對AI的使用率。

雲九資本合夥人任鑫:OpenAI釋出會與你無關
由於大家都是從業者,因此對AI格外關注,還會守著這次OpenAI釋出會的直播。在這裡我想給大家提供另一個視角,僅代表我個人的觀點,只是給一些業外的朋友們一點建議:建議大家不要關心這件事,它不重要。
首先,如果你不是專業人士,不要花太多精力預測AI的未來。我常常會跟一些CEO或者研究員聊到這個話題,最後的結論是,很多業內專業人士的觀點並不一致。這告訴我們要充分相信一件事——沒有人知道未來會怎樣。既然沒有人知道未來會怎樣,我們只要明確一件事:你現在的狀態如何以及你想不想蹭到AI的紅利。如果你的狀態足夠好,你可以有選擇。但如果你現在的狀態欠佳,心裡又躍躍欲試,這個時候其實更不需要預測,因為你沒有選擇,必須參與。如果想要跟上時代趨勢,你只能投身其中。
其次,要具體地思考問題,不要抽象地評判。OpenAI會不會被Google 打敗?Deepseek與GPT-4o哪一個更好?如果你是應用方,最好不要這樣去思考問題。你的思考落點一定要非常具體,把具體的事物放置在你的場景裡,判斷它會產生什麼樣具體的結果,這才是業務導向的思維方式。

雲九資本合夥人任鑫:不要想太多,先要多用起來
大家有可能聽過一種說法,說AI應用不夠廣泛。但是實際我們調研下來發現,現在AI的應用已經極其廣泛,只是大家沒有大聲吆喝。比如前幾天的OpenAI掉線了一會兒,然後推特上鋪天蓋地都是學生在哭喊:我的論文怎麼辦?我要交作業!小朋友們用它來寫作業這件事情已經非常普遍。然後國內大模型的應用場景當中,一個非常巨大的板塊叫做寫公文,寫報告,也是鋪天蓋地地在用。
還有當你在網上招聘,你給他電話面試、影片面試的時候,很多小朋友已經在他的電腦上開了一個copilot,你問任何問題,copilot都會結合他的簡歷和回答來幫他即時作弊。所以,我建議大家不要低估世界的發展,年輕人已經都用起來了,如果我們沒有用起來,只是我們老了而已。
我們是一家孵化器,我們會支援一些創業者幫他們把他們的產品實現。在大半年前,我們就已經做到了後端的程式碼沒有一行是人類寫的,全部都是AI寫的。現在我知道已經有無數的公司做到了。
再舉一個例子,前幾天有一個同事讓我看一個美國專案的招聘計劃。但是實際上我是外行,我招他是因為他比我內行,如果按照以前的做法,我會跟他說,這個點你再想一想,我覺得可以怎麼樣,要不要再修改一下,外行指導內行。但是,前幾天我給他的反饋已經變成了:“這件事情你分三個維度,去跟o1聊半個小時,看看它能不能給你更好的建議。如果有的話,你回來告訴我這件事情還有可能往哪些方向最佳化。”我也沒有AI懂,你不如直接去問AI。所以,大家會發現在工作當中,我們相當於引入了一個更好的第三方。
最後,在決策上也是這樣,我們現在已經不是拍腦袋想了,而是每一次都跟AI聊聊。我的很多想法都是跟AI聊出來的。
所以,我強烈建議大家在關注新聞的同時,自己更多地用起來。所有事情都是可以用上AI的,就看你想不想得到。真正稀缺的不是知識,而是實踐的機會。大家一定不要挖空心思去搞懂OpenAI在幹嘛,業外人也搞不懂,趕緊把這些東西全部用一遍,然後在生活當中創造100個實踐的機會。這些機會會逼著你去更好地學習,然後這些更好的學習可以幫助我們創造更多的可能性。
////// END //////


相關文章