真格基金戴雨森:長聊AIAgent,各行業都會遭遇「李世石時刻」(下)

上個月,真格基金管理合夥人戴雨森與「晚點」長聊了一次 AI 與 Agent。我們將這次訪談整理成完整版文字稿,分為(上)、(下)兩期釋出。
在《真格基金戴雨森:長聊 AI Agent,各行業都會遭遇「李世石時刻」(上)》中,雨森解析了 o1 和 R1 模型的突破,指出:「在 Agent 時代,Attention is not all you need」。2025 年,AI 在特定領域超越人類的現象將愈發普遍,這一變革將如何重塑未來,帶來哪些機遇與挑戰?
Q:還有一件對現在的格局影響很大的事,就是 DeepSeek 出圈,這本身影響就很大,而且它採用了非常徹底且一貫的開源方式。我覺得可以分幾個層面來講,一個是大的科技公司,首先原本閉源的大科技公司現在有很多動作,比如說騰訊、百度,都接入了 DeepSeek。而且騰訊接入了很多產品,它的 AI 主力產品元寶接入了,最大的國民級產品微信也接入了,大概有十幾個產品都接了。百度是文心接入了,不過阿里和位元組沒有接入。
你覺得豆包什麼時候會接入 DeepSeek?
戴雨森:如果豆包選擇接入 DeepSeek,我會覺得很意外。因為在我看來,位元組特別想探索智慧前沿,很注重自己基礎模型的研發。要是接入 DeepSeek,不管是對外形象還是對內士氣,可能都是一個挺大的改變。
但從另一個角度說,如果豆包的使用者覺得 DeepSeek 更好用,那從豆包使用者價值的角度來看,這也是合理的。不過我覺得這肯定不是位元組做 AI 的初衷,據我瞭解,他們還是想在 AI 領域實現全面領先,而且他們的人力、資源都很豐富。
Q:那騰訊呢?
戴雨森:我們這都是小道訊息,畢竟作為天使投資人,也沒辦法瞭解他們決策層的想法。之前有人說騰訊做影片是後發先至,讓別人先跑三年,反正微信使用者這麼多,始終都能調動出來。之前就聽說騰訊在模型這塊也是抱著後發制人的想法,因為有使用者的關係、使用者資料,大家又都離不開微信,等模型技術出現收斂或者成熟之後再接入。而且微信是面向使用者的基礎設施產品,不能做太大調整,不然會給使用者帶來很多影響。所以我倒是覺得騰訊接入 DeepSeek 這件事值得點贊。因為我聽說 AI 搜尋去年就開始推進了,但是接入 DeepSeek 這個決定肯定是高層做出來的。
我覺得這對騰訊的使用者來說是好事。聽說接入 DeepSeek 之後,騰訊很多產品的資料增長得很不錯,可能是兩位數的增長。從 DAU 的角度來看,現在很多人點微信搜尋,下面就會出現下載「使用了 DeepSeek-R1 的元寶」的提示,這導量能力簡直是無與倫比的。所以元寶現在在 App Store 排第二名,我覺得明天可能就第一名,這都很正常。
Q:所以你覺得這是騰訊的選擇嗎?就是它在自研大模型方面沒那麼激進,它略慢一籌,它知道會有人做出更好的模型,到時候憑藉微信這個大殺器,再積極接入。你覺得這是它早就設定好的主動戰略路線嗎?
戴雨森:我聽說這是騰訊主動選擇的戰略,但我同時也聽說混元大模型在大量招人來擴充團隊。從中國網際網路過去的經驗來看,大廠很少完全依靠第三方來提供關鍵基礎設施,而不是自己去做。所以一方面,我覺得騰訊現在這個決定非常厲害,也許這會開啟一個新時代。在美國有很多這樣的例子,比如 Netflix 一直用亞馬遜雲服務(AWS),雖然亞馬遜有 Prime Video,是 Netflix 的直接競品,但 Netflix 仍然覺得 AWS 在商業和技術上是最好的選擇。但在中國,以前都是有了支付寶,就得有個微信支付,大家都想有自己的一個東西。不過我覺得選擇 DeepSeek 肯定是個很中立的決定,因為 DeepSeek 團隊也沒打算做一個超級 App,也沒有想去做 to C。
Q:所以我覺得,馬化騰知道梁文鋒對做一個大 DAU 的產品沒那麼感興趣。
戴雨森:是的,所以我覺得他們至少現在目標很明確,雙方合作也有這個基礎。但騰訊會不會一直不想要自己的大模型,這很難說。畢竟技術變化太快了,就像之前大家說微軟就靠 OpenAI,後來微軟好像也打算自己訓練模型,甚至還投資了 Anthropic。所以這些情況都可能發生變化。但我覺得這裡面最核心的,是誰能一直處在前沿。在過去兩年多時間裡,我們已經看到很多聲稱要做基礎模型、挑戰智慧的,都逐漸掉隊了,這也合理,畢竟做這件事需要人才、資金和大量創新。
Q:所以你剛才說,有資格做這件事的大公司只有字節跳動,有資格做這件事的創業公司,目前只有月之暗面?
戴雨森:如果說在獲得風險投資(VC)之前的創業公司,原來說的 AI 六小虎,目前看下來,確實只有 Kimi 在人才、團隊、資金和使用者上,具備這樣的能力。就連 OpenAI 最新發表的一篇論文,還同時 refer 了 R1 和 K1.5 的研究成果。包括今天中午你們來的路上,Kimi 又釋出了 Moonlight 這個最新的開源小模型。我覺得能持續為技術社群做貢獻,是對團隊本身的能力以及方向要求挺高的事情。
Q:說到 OpenAI 的論文同時 refer 了 K1.5 和 R1,這兩個成果其實是同一天釋出的。其實成果剛釋出後,我就去找技術社群的人聊了聊。當時大家給我的反饋是,他們對 K1.5 和 R1 的認可度差別沒那麼大,但最後實際產生的整個影響力差別卻非常大,你怎麼看待這件事?
戴雨森:我覺得開源是一個關鍵差異。確實 DeepSeek-R1 的一些工作意義很大,而且它開源後大家都能使用,尤其在西方引起了很大反響。
本來在過去幾年,矽谷一直有人質疑預訓練花這麼多錢到底值不值。至少從二級市場投資人那邊,大家陸續開始擔心是不是錢花太多了。這時候突然出來說 500 萬美金就能訓練一個 o1 級別的模型,當然這是誤讀,論文裡寫得很清楚,那只是最後一次訓練的結果。但就有人想搞大新聞,在美國引發了大量擔憂,導致 1 月 27 號英偉達股價暴跌 16 個點。當這事情成了全球新聞,它的影響力肯定不是 Kimi 單純發一篇論文或者一個技術創新能比的。
有個和 DeepSeek 很熟的同學跟我說,他們覺得美國的 OpenAI 或者 Anthropic,訓練像 V3 這樣的模型,甚至都不用花 500 萬美金,人家有更大的叢集和更多的訓練經驗。但當時很多不太懂行的人看到這個敘事,就開始拿 500 萬美金和別人融的 10 億美金作比較。但現在大家也漸漸明白不能這麼比。你看英偉達的股價又快恢復了,對吧?
在訓練成本上,真的行內人其實沒覺得 500 萬美金有多驚人,大家可能更關注像當時 MLA 那種降低推理成本的創新。另外,模型的智慧提升以及模型訓練與推理成本的下降,這是一直在發生的事兒。比如說 GPT-4 的 API 推出後,成本已經下降了 90% 多,今年肯定還會降 90% 多,這是必然的。晶片會更強大,大家也會找到更多降低成本的最佳化方法。所以我覺得現在大家首先關注的還是智慧能不能提升,只要智慧能提升,成本肯定會快速下降,可能每年降到原來的二十分之一甚至幾十分之一。所以對降成本倒不是特別擔心,至少在美國,大家相信這個曲線一定會發生。
Q:所以降成本其實在一個軌跡裡的,後來 Anthropic 的創始人 Dario 不是寫了一篇很長的文章嗎,他前面的分析還挺充分的,就是說降本是在大行業的曲線上。
戴雨森:對,包括智慧提升方面。當然篇文章後面寫得有點氣急敗壞了,但我覺得他對前面技術的分析挺正確的。按照他的說法,他們對 Sonnet 模型的對齊工作經歷了很長時間,因為他們很強調安全性之類的。確實,Sonnet 甚至都不算一個推理模型,所以他們還是挺厲害的。
聽說他們馬上要釋出 Claude 4 了,我覺得這從一部分來說也許也是 DeepSeek 帶來的好處,就像鯰魚效應一樣,模型界來了一個實力強勁又要開源的對手,大家就不得不加快步伐了,這確實是件好事。而且回過頭看,DeepSeek 還有個優點,它是一個全新的應用,一上來就是 R1 和搜尋的結合,是從一張白紙開始做新產品,這是個大的特點。
還有個特點,我後來才意識到,大家在訓練推理模型的時候,其實都是對標數學和程式設計能力。我們看 DeepSeek、OpenAI 還是 Kimi 發的論文,都是用美國數學邀請賽(AIME)、數學競賽(MATH)、程式碼基準測試(Code Bench)這些來做對標。但 DeepSeek 出現後,突出的反而是它的文筆。聽說它第一次專門做了文筆方面的對齊工作,甚至還找了北大中文系的人來做標註。
我們一開始看到它的回答時,第一反應是覺得說得有點天馬行空,動不動就扯到量子力學。其實對 OpenAI、Kimi 還有豆包來說,它們之前一直是要避免這種情況的,因為訓練模型時都怕模型胡說八道。
但我覺得 DeepSeek 一方面可能是有意在文字上做了對齊,另一方面,畢竟它之前定位是 research lab,所以沒太對所謂的中立性、truthfulness 進行微調,所以它釋出後大家直接就用了,沒想到這個特點反而成了好的特性。
我們發現很多人傳播它,就是因為覺得它的回答、思考過程特別有創意,我不知道這是不是陰差陽錯,但事實上也會導致它傳播率更強。
Q:你跟圈子裡的人聊過嗎?他們覺得這是陰差陽錯造成的嗎?他們是有意訓練的寫作能力嗎?
戴雨森:我聽一些人說,他們可能確實在寫作能力方面對模型進行了加強,但也有人覺得這或許是對齊不夠充分導致的結果。所以我覺得這兩種情況都有可能,我確實也沒有確切的答案。
不過單從結果來看,這是出圈的一個很重要的原因。因為真正用它做數學題的人沒那麼多,大部分人反而是拿它來算命之類的,然後突然發現它給出的結果讓人覺得很有道理。還有像 MBTI 測試這些,大家並不覺得這是一個 AGI 的前沿模型該做的事情。
Q:大家對 DeepSeek 還有一個比較好奇的點,就是它到底是怎麼賺錢?剛才我們也聊到,騰訊、百度,還有很多大小的公司都接入了 DeepSeek。不過我理解,它實際上不會直接從這些接入裡賺錢,對吧?
戴雨森:如果你只是用它的模型,它已經開源了。DeepSeek 目前能直接賺錢的方式就是賣 API,而且我聽說它的 API 是有毛利的。因為他們在推理方面做了很多 infra 的創新,所以相比其他公司,他們 serve 自己的模型成本更低。
現在很多人都想用它的 API,可它現在面臨的問題是算力不夠。因為它還要進行模型訓練,前陣子它好像還關掉了 API 充值入口,意思就是別給我錢了,我服務不過來。這就是商業模式的一種體現,很多人都問能不能付錢買一個穩定的版本,有點像 GPT Plus 那種訂閱制。所以我一直覺得,在技術革命的早期,不要太快的用成熟期的標準去要求商業模式。應該先靠技術為使用者和客戶創造價值,然後再從這些價值中提取一部分作為收入。我覺得這是遲早會實現的,只是需要一些耐心。
Q:關於這個事情你是在 2024 年就有了清晰的認知?還是說在受到 DeepSeek 帶來的衝擊或者啟示之後,才有了更清楚、更堅定的想法?
戴雨森:我覺得這也是一個不斷學習的過程。我們 80 後入行的時候,移動網際網路已經逐漸興起,或者說網際網路已經進入下半場了。在最早期,比如 90 年代的時候,我那時候也是網際網路使用者,但當時根本沒考慮過商業模式的問題。我覺得應該經常以史為鑑,想想為什麼很多早期的網際網路公司,都是憑藉當時很強的技術做起來的。
其實覆盤一下 Google 遇到的第一個問題,它用 PageRank 這項新技術打造出了體驗好 10 倍的搜尋引擎,使用者特別喜歡,還自發傳播。但那個時候它其實不知道怎麼賺錢,因為一開始谷歌的搜尋引擎是沒有廣告的,介面很清爽。1998 年上線後,2002 年《紐約時報》有篇文章就說「Google最難搜尋的就是它自己的商業模式」,批評它沒有自己的商業模式。但後來大家也知道了,2002 年它逐漸找到了 AdWords 和 AdSense 這兩種商業模式,2004 年上市後成了現在最好的「印鈔機」。這是個很好的例子,一開始你問  Google 商業模式是什麼,它其實也不知道。但它首先是有技術突破,憑藉技術打造出好產品,然後再把產品的價值變現。
Q:所有的技術突破都會有這樣水到渠成的過程嗎?還是說我們存在倖存者偏差,只是看到了那些後來取得巨大商業成就的技術突破?
戴雨森:當然,不可能所有的技術突破都能賺錢。不過我覺得,得看技術突破處於哪個發展週期。我還是那個觀點,現在是一個技術變化斜率很陡峭的時候,那這個時候,要是逼著現有的技術去變現,就好比讓一個天資聰穎的高中生去賺錢,他可能只能去做些搬磚之類的活,賺不了什麼大錢。但要是多培養他,等他成為博士生,那就能賺大錢。所以我覺得,如果技術發展已經到了平緩期,比如移動網際網路,五年前的技術和現在沒太大區別的時候,那才是商業模式百花齊放的時候。
我再舉個例子,不只是 Google,Facebook 剛出現的時候,提出了一個非常前沿的產品,引發了「病毒式」傳播。但那時候大家也不知道 Facebook 怎麼賺錢。它嘗試過放橫幅廣告,嘗試過本地廣告,後來還做過遊戲中的廣告,可這些都沒賺到什麼錢。直到2012年,它把 news feed 從時間排序(就像微信那樣的排序方式)改成了推薦排序,形成了所謂的資訊流推薦模式。只有做成了推薦資訊流排序,才能插入廣告。所以它在 2012 年推出了資訊流廣告(news feed ads),並且同年上市。當然現在資訊流廣告也是超級「印鈔機」,字節跳動的核心商業模式。但 Facebook 是 2005 年上線的,資訊流在 2007 年上線,推薦資訊流是在 2012 年上線,同時找到了真正的商業模式,這中間花了 6 到 8 年的時間。那時候 Facebook 一直是使用者很喜歡、但商業模式不清晰的公司,所以偉大的公司往往都經歷過這樣的階段。
Q:你覺得字節跳動會開源嗎?
戴雨森:首先,開源是不是每個人都必須做的事?第一,得處於領先地位,開源才有價值。要是開源一個不怎麼樣的東西,只是為了開源而開源,那沒什麼意義;第二,我覺得開源稍微弱一點的形式就是免費。免費加領先,我覺得這就很厲害了。
是不是一定要開源?我覺得這次 DeepSeek 有個「甜頭」——它開源後引起了西方的高度關注。在美國引發大新聞後,回到國內大家就更覺得它厲害了,讓美國人「破防」了。當然,開源也有像和微信合作這樣的形式,但我在想這不僅僅是開源的問題,而是公司得堅持做這件事。比如說,假設現在豆包開源,微信會接入嗎?我估計不會。所以這不是開不開源的簡單問題。假設豆包現在和 DeepSeek 一樣厲害然後開源了,我估計微信也不會接入,阿里的千問估計也不會。這不是說它們能力不行,而是從阿里和位元組的立場來看是這樣。所以我覺得梁文鋒他們厲害的地方不只是開源,而是他們堅持開源,而且他們的市場定位是一個不會讓大家感到威脅的定位。
Q:對,堅持開源,而且保持中立,沒有接受某個大廠特別多的投資。
最近還有個變化,就是 OpenAI 也在考慮開源。阿爾特曼(Altman)發了一條推特,給大家兩個選項:一個是可以開源 o3 mini,還有一個是可以開源 phone size 的 model,就是一個適用於手機端的模型。你更期待它開源哪個呢?
戴雨森:當然,我覺得開源哪個都很好,但我肯定對 o3 mini 更感興趣。因為我覺得目前手機端的模型用途可能還不是那麼大,現在大家更需要在智慧前沿取得突破。o3 mini 是一個很強大的模型,在經過較長的推理時間,也就是現在 GPT 裡的 o3 mini pro、o3 mini high 模式下,它的表現非常好。如果這樣級別的模型能夠開源,大家能知道它是怎麼做出來的以及它的特點,我覺得對大家會有非常大的價值。而且聽說這個模型的規模也不大,所以這可能對大家在模型訓練和應用方面會有很多借鑑意義。
Q:你聽說它有多大?
戴雨森:比較可靠的訊息來源,聽說它每次啟用的規模是 3.7B 的大小,這確實讓我有點震驚,感覺確實有點太小了。但這個尺寸意味著,他們確實能把一個很大的 o3(o3 應該是挺大的),變成一個很小的 o3 mini,然後讓 o3 mini 經過更多的思考時間,從而得到很好的結果,這確實是一項很厲害的工作。
Q:他們之前其實分享過自己不開源的顧慮,他們認為開源會削弱競爭優勢,比如會給 Google 可乘之機。
戴雨森:所以我覺得這是梁文鋒偉大的點,他確實把很多技術秘密分享給大家,讓大家都能變得更好。但從純商業公司的角度來看,確實會有很多擔心。畢竟除了剛剛說的問題,OpenAI 還擔心強大的 AI 會被壞人利用,這可能也是一個很合理的擔憂。
Q:你覺得 DeepSeek 對那些本來就在開源生態裡想要主導的公司,比如 Meta 和阿里這樣一直都在開源的公司,會有什麼影響呢?
戴雨森:我覺得肯定是一種激勵。大家發現來了一個更「卷」的對手,原來開源社群,開玩笑地說有點像「賽博佛祖」,有點做慈善的感覺。不管是阿里還是 Meta,都是大公司拿出算力給大家用,帶動整個行業發展。但現在來了一個進步更快、更開放的 DeepSeek,這肯定對大家來說既是壓力也是激勵。但確實,我覺得 DeepSeek 的中立性是一個比較獨特的優勢,騰訊也可以用、千問也可以用,這不僅僅是能力的問題,是他的屁股坐在哪兒的問題。
Q:蘋果最近不是也和 DeepSeek 有過溝通合作之類的嗎,不過最後它選擇了阿里。
戴雨森:蘋果和很多公司都聊過,也和 Kimi 聊過。我覺得從蘋果的角度來看,選擇阿里很好理解。它肯定要選一個服務穩定,能很好應對大規模使用者量,不管是 infrastructure、服務還是技術經驗等方面都很出色的合作伙伴。
Q:其實這一輪阿里還是比較開放的。
戴雨森:千問和 Llama 挺相容的,而且它的產品模型不錯,更新也很頻繁,所以其實很多開發者都在用千問。說實話,DeepSeek 的 R1 在使用的時候,因為存在很多「幻覺」,所以如果用它來做應用,可能不一定是最好的選擇。
Q:在 DeepSeek 全民爆火之前,在海外技術圈,我覺得千問和 DeepSeek 的影響力是比較相當的,因為它們倆都是開源系列的。
戴雨森:確實,覆盤一下就會發現,不管 Kimi 的 benchmark 做得多好,如果對別人不開放,不能開源使用,也不提供海外應用服務,那在海外確實就沒有認知度。
Q:你們之前是怎麼討論的,Kimi 為什麼不開源?
戴雨森:我覺得即便到現在,開源也不是一件必須要做的事情。就像我剛才說的,開源只是公司在某些情況下的一種選擇。比如說,在沒有保密競爭壓力、沒有融資壓力的情況下才會考慮開源,而且我們現在看到的是事後的結果,因為開源再加上一些偶然的機會才會有現在的情況,所以我覺得開源不是必備選項。當然,選擇開源的人很厲害,非常值得尊敬。但對於一家商業公司來說,核心還是在於能不能創造使用者價值,並最終將使用者價值轉化為商業價值,所以我覺得開源不是必經之路,只是一條很有意思、很創新的路。
Q:但今天所有的探索 AGI 的公司都不會以使用者價值作為核心的。
戴雨森:很多還是以技術價值為主。我只是說在技術增長期,只有技術價值提升了才能帶來使用者價值。所以我覺得在技術前沿進行探索是非常關鍵的。大模型出現之後,可能湧現出了一批所謂比較務實的投資人或創業者,他們想著用現有的技術去賺錢。但我覺得 Kimi 肯定屬於另外一類,它是要推動技術前沿的提升,這又回到我們一開始說的,打造出令人驚歎、如魔法般的產品體驗,最終獲得商業價值。
其實 Kimi 在 2023 年火起來,它火一個很重要的原因是,它是第一個把 chat、搜尋和長文字結合起來的產品。大當時 ChatGPT 是不能搜尋的,而且 ChatGPT 對於長文字、多文字、多檔案的處理也不是很好。所以 Kimi 在前兩三年,就是憑藉著長文字處理的技術理念,以及將搜尋和聊天相結合,帶來了不一樣的使用者體驗,從而成功出圈的例子。
Q:當年選擇做長文字是非共識嗎?做這個決策很難嗎?
戴雨森:其實當時長文字肯定是技術選擇中的一個選項,但要不要把它放在最重要的位置去做,我覺得這並沒有達成共識。當時有個不知道真假的段子,據說百度在 Kimi 火了之後,就說為什麼 Kimi 做了長文字他們卻沒做,好像是說長文字的優先順序沒排在他們第一批要做的事情裡。因為當時還有很多其他優先順序更高的事情可以做,比如也有很多人做 CharacterAI,做那種情商方向的對齊。但 Kimi 堅定地選擇了長文字,並且把它做到了極致。因為長文字能解鎖兩個關鍵場景,一個是處理多個檔案,第二個就是搜尋,比如看 100 個網頁然後進行總結,這兩個場景沒有長文字是做不出來的。
尤其在當時,Kimi 剛成立,還沒融到那麼多錢。團隊也是年輕人、小團隊,資源受限,必須專注在一件事情上,選擇一個正確的方向。其實 DeepSeek 現在火的很多因素,放到 2023 年的 Kimi 身上也是成立的。當資源有限的時候,就要在一個關鍵的點上實現突破,給使用者帶來那種非常驚豔的體驗,這樣才能出圈。所以我總結了一下,發現有很多相似的地方,這不是往自己臉上貼金,我是真覺得它們有一些相似之處。
Q:那長文字對 Kimi 現在做的事情有幫助嗎?
戴雨森:比如說同樣做 retrieval,Kimi 在 truthfulness、準確度方面其實做得更好。當然,普通使用者可能不會去這麼對比。說實話,現在很多用 DeepSeek 的使用者,對於產生的「幻覺」是沒感覺的,但說不定你用它寫個報告,回頭就被坑了。我昨天就遇到了這種情況,在一個群裡,群裡的人還都挺有水平的,有人發了篇文章,我一看,裡面 DeepSeek 味道怎麼那麼濃。
Q:你覺得 DeepSeek 大火出圈之後,對之前這段時間經常被拿來和它比較的大模型「六小虎」,會有什麼直接衝擊?
戴雨森:說實話,我覺得它確實起到了清場的作用。在 R1 出圈之前,「六小虎」裡就有幾家已經不做自己的技術模型訓練,也沒打算衝擊 SOTA  了。我覺得 R1 出來之後,也讓大家意識到,如果沒有做到 SOTA 的可能的話,確實還不如去做垂直領域或者應用開發。
Q:他們放棄是因為什麼?
戴雨森:有資金的原因,也有團隊、自身定位的原因。我們作為 Kimi 的天使投資人,實際來講,就拿 K1.5 這個模型的表現,以及他們接下來要釋出的模型來說,在我們剛才提到的 MATH、coding 方面還會有進一步的表現。從學術貢獻上看,至少從 reasoning 方面,K1.5 提出的 long-to-short 等技術分享 得到的評價也挺好的。而且今天釋出的 Moonlight,還有前兩天釋出的 MoBA,這也說明 Kimi 團隊有能力持續和技術同行進行交流輸出。
同時,Kimi 現在的使用者量已經達到了千萬 DAU 的級別,而且還在持續增長。說實話,不少人在用過 DeepSeek 和 Kimi 之後,在很多場景下還是更喜歡 Kimi。比如說 Kimi 的「幻覺」更少,在一些工作場景中表現更好。在一些多模態推理方面,像拍照搜題這些場景,目前 DeepSeek 還沒做。所以,可能我這話有點私心,但我確實覺得從團隊資金、技術能力、使用者產品這些角度來看,Kimi 是現在「六小虎」裡唯一有能力持續參與 SOTA 模型競爭的。當然,這條路很難走,需要錢、需要人等各種條件,但我覺得至少值得一試。
Q:Kimi 接下來會更專注嗎?會砍掉一些東西嗎?
戴雨森:他們已經砍掉了很多東西,比如海外業務,他們現在就是要繼續衝擊 SOTA。
Q:他們正式不做影片生成了嗎?
戴雨森:至少從目前來看,我覺得有所不為很重要。
Q:「六小虎」裡的多數(公司)在 DeepSeek 出來之前就已經放棄了,這在你的預期之中嗎?
戴雨森:其實在 2024 年年中我們就感覺會是這樣的結果。因為那個時候就有幾家很明顯,不管是從意願還是資源方面,都很難再繼續下去了。我覺得 Kimi 有一點挺好的,就是它的團隊非常穩定。這和他們團隊的構成有關,聯合創始人之間都有長期合作。可以看現在各家模型公司人員變動都挺大的,其實創業就像走平衡木,走著走著同行的人就越來越少,很多時候能一直留在牌桌上就已經很厲害了。
Q:剛才我們主要聊的是 DeepSeek 對模型公司的影響,包括大公司,不管是開源的還是閉源的,還有一些創業公司。接下來可以聊聊其它生態裡的公司,比如說,在 DeepSeek 帶來的更開源的風潮裡面,會產生什麼樣影響?我想到一類公司,就是 AI 雲平臺。按 DeepSeek 的預告,接下來的開源周它是要開源 infrastructure 層的一些推理最佳化技術,那這對矽基流動、無問芯穹這類公司在創業方面可能會有什麼影響呢?
戴雨森:我們是無問芯穹的天使投資人,他們的業務量增長得很厲害,收到了很多需求。尤其是各地國資、政府都在拼命想部署 DeepSeek,這方面的需求暴漲。
他們做了很多創新,包括在華為的卡上做推理也很火,很多人都想用。我覺得開源模型的「火」,確實給 AI Infra 公司帶來了很好的機會。原來這些公司要 serve 什麼模型?如果都是豆包、Kimi 這類閉源、私有模型,那它們確實發揮不了什麼作用,因為字節跳動自己會做 serve。但從長遠來看,還得看它們能不能持續服務好客戶。畢竟公有云公司,像騰訊雲、阿里雲、火山引擎,確實資金充足,Infra 能力、資源包括客戶服務能力也更好,所以對於客戶來說,他們肯定也不是做慈善,誰能服務得好,又價廉物美,他們就選誰。所以對創業公司來說,還是有很多挑戰的。
而且 DeepSeek 要開源這些「黑科技」,這意味著它在服務方面其實也有很多優勢,同樣的服務它成本可能比別人低。因為短期內因為算力需求激增這肯定誰也沒想到,它自己扛不住,讓別人來承擔這也很正常。但如果進入穩定狀態,這些創業公司面對大的公有云公司和 DeepSeek 第一方服務,是否還有優勢,這還得再觀察。但總體來說,肯定是創造了很多機會。
Q:其實 AI 雲平臺夾在雲和模型中間對吧?它有可能受到兩邊的擠壓,但也可能因為生態的變化獲得一些機會。
戴雨森:對,如果開源之後中間這一層的選擇變多了,比如有不同的框架、不同的模型可供選擇,那中間這一塊就會變得越來越好。但如果最後像作業系統那樣,收斂到只剩下像 iOS 或者安卓這樣的少數選擇,那可能最後還是由系統提供商來提供。
Q:你覺得它對廣大隻做應用的公司會有什麼影響?
戴雨森:我覺得肯定還是正面的。就是多了一個更好的、開源的、還能自己微調的模型可以用。在這個過程中,要是想在模型的主航道上做 office 相關的事情,那還是挺難的。但要是做的事情是豐富模型生態,那就不一樣了。我一直打比方,在技術革命的早期,就相當於黑莓時代。因為那個時候黑莓技術能力有限,所以你有的 PMF 是很少的。黑莓時代主要就是發郵件、發信息。就算張一鳴回到那個時代想做抖音,也做不出來,因為黑莓不具備那樣的條件。但後來移動網際網路為什麼能蓬勃發展?首先是因為有了 iPhone,它實力夠強,解鎖了很多新場景。它有好的攝像頭、好的螢幕、好的網路、好的晶片,所以才能解鎖短影片、移動電商、社交網路這些場景。
iPhone 之後就是安卓,安卓讓市場變得更開放,小米、OPPO、vivo 等更多手機廠商加入進來,進一步把智慧手機普及開了。比如說 Sonnet 和 4o、o1,有點像 iPhone 時刻,就是閉源的技術進步讓很多人能在它上面構建應用。而 DeepSeek 可能就是安卓時刻,它從閉源變成開源,同時實力也足夠強,讓大家做應用有了更多選擇。所以技術進步一方面能帶來更好的產品體驗,導致出現「殺手應用」;另一方面也能讓生態變得更繁榮。原來只能做有限的幾件事,有了 iPhone 和安卓之後,才能做抖音。
Q:然後我還想聊聊 o1 和 R1 對大家都很關注的基礎設施算力需求的影響。其實 DeepSeek R1 有段時間特別火,這和剛才我們說的英偉達股價大跌有關係。有一種觀點覺得,是不是因為它訓練成本低,所以會減少對算力的需求。包括我看你也發了一些朋友圈,很多人對此也有不同看法。
戴雨森:我覺得算力需求有不同的結構。原來就是訓練和推理,在 2023 年到 2024 年的軍備競賽階段,大家簡單總結成一句話叫「大力出奇跡」,好像覺得只要買足夠多的卡,就能得到更好的結果。當然,那個時候預訓練還沒撞牆,或者大家還沒意識到撞牆的時候,這麼說也能成立。
但現在我們發現,pre-training 短期大量投入,確實邊際效益是有限的。比如 Grok 3 是用 20 萬張卡訓的,雖然有進展,但邊際效益在遞減。所以不能說「大力出奇跡」是錯的,只是它產生奇蹟的邊際效益在遞減。但我認為會發生的事情是,由於模型的能力已經達到了做 Agent 產品的臨界點,並且還在不斷突破。所以當 Agent 產品形態能落地之後,它使用的 token、inference 的算力會大幅增加。如果只是做 chatbot ,你和 ChatGPT、Kimi、豆包聊天,沒那麼多能聊的,花不了多少 token。當它能幫你做更多、更復雜的事情,需要更多工具、思考時,inference 算力的需求可能不是提高 10 倍,而是 100 倍、1000 倍地增長。這種情況之前沒法發生,因為技術沒達到那個程度。但現在我覺得技術到了這個轉折點,推理需求可能會大幅提高。
Q:百倍千倍的推理算力需求增長,會在 2025 年就出現嗎?
戴雨森:首先,從技術發展歷史的角度來看,是 2025 年、2026 年還是 2027 年發生這件事,其實一點都不重要。就像自動駕駛,最終它能發生才是最重要的,具體在哪一年實現,其實沒那麼重要。
但我覺得現在 Agent 產品,至少我能感覺到它已經快要出圈了。比如說 Deep Research,它需要的 token 肯定多很多。這也就是為什麼阿爾特曼說 GPT Pro 雖然每月收費兩百美金,但還是在虧錢,因為那個時候 inference 的需求增加了很多。不過我覺得這裡面有兩個情況,一是 pre-training、post training inference 花的佔比會發生變化;二是這確實會對英偉達產生格局上的影響。在 2025 年 2 月,英偉達在推理和訓練方面,肯定還是效能最強且效率最高的選擇。不過我們也看到,當 R1 火了之後,國產晶片就開始針對 R1 進行優化了,這種定點最佳化其實效果更好。
Q:其實已經在用昇騰了。
戴雨森:他們已經看到昇騰的 910B 了。
Q:而且即便用英偉達的產品,也可以用 FP4 推理技術的最佳化。
戴雨森:是的,我覺得一直以來都存在這種情況,當技術還沒有收斂時候,GPU 具備很強的通用性。或者為什麼會有英偉達?最早都是 CPU,它是最通用的。後來大家要玩遊戲,遊戲有很具體的需求,所以就做了 GPU,專門用來加速遊戲,當然後來 GPU 可以做 AI。目前,GPU 對於 AI 的通用訓練和推理來說,還是最通用的選擇。但要是隻服務於某一個具體的模型,有兩種做法。一種是像昇騰這樣,可以專門做最佳化;另一種做 Eclipse,像博通、Marvell 那樣去做。
Q:或者像谷歌做 TPU 那樣,針對自身的需求去最佳化。
戴雨森:其實這也是一種專用化。一旦架構穩定下來,在晶片領域通常就能透過專用化來實現更高的效率。所以這裡就涉及到架構到底會不會固化下來,我覺得這也是大家激烈討論的點。目前來看,O1、O 系列這條路能走得很遠,那可能 ASIC 就會逐漸 work。但從另一個角度,假設明年、後年架構基礎發生變化,Transformer 都不 work 了,換成其他架構,那做 ASIC 可能就白做了,還得依靠 GPU,所以這裡面有很多不確定因素。不過英偉達確實存在一個問題,就是它現在市場份額太高了,很難 go up。
Q:對,它好像已經到頂點了。
戴雨森:對,它的市場佔有率都 90% 多了,所以有往下走。這種走下坡路的可能性讓很多人很擔憂。現在一方面大家對未來算力需求的預期比較高,另一方面對英偉達的市場格局以及由此帶來的毛利率預期也比較高。一旦市場格局出問題,它的毛利率可能也會受影響,這是大家比較擔心的地方。但要說現在大家都在做什麼,包括 DeepSeek 最想獲得的是什麼,肯定還是英偉達的產品,能買多少就買多少,想盡辦法去買。
Q:其實這一波最穩的還是博通。
戴雨森:博通或 Marvell,這兩個表現都挺突出的。但要是說 ASIC,第一,基本上得到 2027 年才能用得上;第二,這裡面還存在一些情況,比如價格變化可能會導致 ASIC 這條路不 work。並且要做出 ASIC 並投入使用,在產能、良品率、效率等方面也有很多問題,不是說想設計就能做出來的,所以這裡面有很多不確定因素。
當然,英偉達也遇到了一些問題,比如液冷問題、整體良品率問題等。反正我認為 Agent 產品的落地,對算力來說肯定是整體利好的,大家現在也都聽到了這個詞傑文斯悖論。但英偉達市場格局是否會變化,只能說出現了一些新的可能性。所以對於炒股票的人來講,Deepseek 出來後的第一反應可能是看到相關新聞先拋售再說,現在好像問題不大,再加回來。
Q:我們剛才聊了很多對未來的展望,有些可能今年就會出現,有些可能要等很久之後。總結來說,你覺得 2025 年我們大機率會看到些什麼呢?
戴雨森:我覺得我們會看到更多的「李世石時刻」,就是在一些任務上,AI 超過 99% 的人類,其實這種情況已經在陸續發生了。比如說寫程式碼,現在 AI 寫程式碼的能力應該比 99% 的人類都要強。
Q:是超過 99% 的程式設計師,還是 99% 的人類?
戴雨森:我現在說的是人類,但我覺得超過 99% 的程式設計師可能也快了。因為在 Codeforces 競賽級別的程式設計中,AI 已經超過 99% 的程式設計師了。不過競賽級程式設計和日常程式設計產出不太一樣,日常程式設計可能需要更多的上下文資訊,還要讀取各種程式碼庫。但我覺得類似這樣 AI 在能力上打敗人類,或者打敗精英人類的情況會越來越多,我們會看到更多讓人驚歎的相關新聞。另外,我覺得會有更多以更方便、更實用的形式呈現的 Agent 產品出現,成為現象級產品。可能不會有幾億人使用,但我覺得能進一步破圈,達到像 Cursor 那樣的破圈程度。
Q:Cursor 現在的日活是多少啊?
戴雨森:日活我不太清楚,但它的年度經常性收入(ARR)大概有 1 億美金左右。日活很難衡量,所以別用日活來衡量 AI 產品。使用者願意為產品提供的價值付多少錢,這可能才是關鍵。我覺得模型的發展速度會加快,開源和經驗分享也會增多,這還挺有意思的。其實在中國,我們現在剛有了在美國經歷 ChatGPT 爆火時的那種感覺,因為現在各地的政府都開始用 DeepSeek 了,大家也都在接入 DeepSeek,我覺得這對於提升大家對 AI 的認知度很重要。大家會意識到,原來 AI 這麼厲害。之前 Kimi、豆包等模型加起來可能也就幾千萬的 DAU,月活可能都不到 2 億。我覺得這也就是讓大概十分之一的人用上了比較先進的 AI 模型。但要是能讓百分之幾十的人都試用過比較先進的模型,感受到 AI 的強大,那不管是從創業者、使用者、新產品的角度,還是從投入資源和資金的角度來看,我覺得整個行業都會迎來一場像寒武紀生物大爆發那樣的生態繁榮。
Q:現在是 2025 年,你也說過,2025 年在有些領域可能會出現「李世石時刻」,也就是 AI 超過 99% 的人類,甚至是精英人類。我感覺 DeepSeek 這個事兒,讓整個行業發展的速度變得更快了。那你覺得,如果我們更快地實現 AGI,或者在更多領域解鎖「李世石時刻」,之後會怎麼樣呢?我現在都有點想象不出會發生什麼變化,比如人要去做什麼,社會結構會怎麼改變。
戴雨森:我覺得我們正處在人類歷史上一個非常有意思的時期。其實指數增長是世界發展的常態,因為我們每年都是在前一年的基礎上增長。但能親眼見證並親身感受指數增長,是很罕見的事情。
Q:你說的指數增長是指什麼?是經濟總量,還是其他方面?
戴雨森:GDP 每年增長 2%、3%,這不就是指數增長嗎。不過一般來說,這種指數增長得用一生去體會。比如說,今年和明年比可能變化不大。但在 AI 上,具體講,從 o1、o1 Pro 再到 Deep Research,我在短短幾個月內就明顯感覺到了它的指數級增長,這種體驗很特別。而且我覺得這會讓我們對未來的預期發生很大的改變。
所以現在很多人都在問,AGI 是什麼,實現 AGI 之後會怎樣。我個人覺得,AGI 確實會對生產力、社會,甚至政治、文化都產生很大的影響。但具體它到來之後會有什麼影響,我覺得我們得做好應對沖擊的準備。因為像安全問題,以及新技術出現後如何解決社會福利問題,我覺得只有當這些情況真正發生時,大家才會真正重視起來。
Q:而且這個能力掌握在誰手裡,其實是影響世界格局的。
戴雨森:所以加速主義就認為 AI 肯定會發展,壞人會用 AI 去做壞事兒,所以好人應該更快的發展 AI。
Q:比如會出現搞金融詐騙的情況,包括像韓國之前出現的那種 Deepfake AI 色情。
戴雨森:所以就得有更強大的手段去偵查 Deepfake,因為人已經沒精力去甄別了,我覺得這肯定會帶來巨大的影響。其實我在想,一方面很多人可能會失業,我覺得這種情況大機率會發生。現在大家對通 AGI 的定義就是它能替代多少人的工作,如果 AGI 的作用就是替代人的工作,那實現了 AGI,不就等價於很多人會失業嗎?當然,這是從社會層面來說。也有人說那個時候物質會極大豐富,每個人都發錢了,但我也不知道到底會怎樣,我覺得肯定會有很多衝擊。
但從另一個角度看,我們人眼中的真實會發生巨大變化,不管是影片生成、圖片生成還是內容生成。我是 1986 年的,我出生的時候,一個人能接觸到的資訊全都是經過權威認證的,要麼是書、要麼是報紙,不然根本沒辦法出版傳播。後來網際網路的巨大意義在於,能讓普通人寫的東西被大家看到,現在 AI 變成了你想要什麼就能生成什麼。其實我發現,包括我自己在內,很多時候都沒有判斷力了,沒辦法甄別資訊的真假。所以在這樣的環境裡,如何進一步適應,建立起自己的認知體系,我覺得這是非常重要的問題。
Q:有一個網路流行語,現在越來越有深意了,它大概意思是「影片沒法 P,所以是真的」。
戴雨森:對,現在影片都能生成了。我覺得這對我們的社交以及認知世界的方式都會產生很大的影響。我發現科技發展有個規律,第一波往往是最厲害的人創造出最強大的技術,第二波就是用強大的技術為最厲害的人打造最強的工具。就拿計算機來說,一開始它是為了解決核爆炸問題或者破譯密碼問題而出現的。這種為「超人」設計的超級工具,會逐漸走向大眾化,普及到普通人,然後變得小型化進入家庭,再發展到移動化,到處都存在。
我們現在還處於最厲害的一群人給精英人群打造超級工具的階段。但我覺得這個東西最終肯定會惠及大眾。當初我們投資王慧文的光年之外,口號就是「加速 AGI 普惠人類」,我覺得普惠大眾肯定是最終的結果。不過中間肯定會像威廉・吉布森說的「未來已來,但分佈不均」,現在確實分佈得不均勻。所以我覺得不管是 DeepSeek 這種開源也好,還是像 Kimi、豆包這種大使用者的產品也好,其實都在加速未來更加均衡地分佈,這都具有重要的意義。我覺得新技術最終是要惠及大眾、全人類的,這樣才有真正的價值,而不是隻掌握在少數有錢人或者少數公司手裡。我覺得這整體來說是我希望看到的結果。
Q:我比較好奇,你個人在為可能更快到來的 AGI 做一些什麼準備?
戴雨森:鍛鍊身體。我覺得在投資領域優秀的創業團隊其實很重要。有了更多的技術創新之後,創業者就顯得尤為重要。當然,梁文鋒一開始也是創業者,只不過他太厲害了,自己炒股、自己做量化就能賺到錢。還有很多可能成為梁文鋒那樣的人,他們或許缺少啟動資金。所以我覺得 VC 在這個時候很重要,尤其是早期投資。因為從理論上來說,早期投資承擔的風險最大。要是很多事情都已經確定了,那也就不需要我們了。但我覺得現在又回到了一個充滿不確定性的時期,不是每個人都能像梁文鋒那樣,自帶 100 億乾糧。
Q:你覺得下一代應該如何接受教育?他們應該學習什麼?我覺得這是很多人都在思考的問題。
戴雨森:我認為最重要的是提出問題的能力。比如說,我經常會遇到這樣的情況:面對一個能力很強的 deep research,我應該問他什麼?我應該如何指揮他?作為 AI 公司的老闆,我每天要考慮讓大家做什麼,今年的方向是什麼,這個月的重點是什麼。這個過程其實需要大量思考,因為事情不會自己推進,我們需要主動決定方向。但目前的教育體系更多是教授學生「會做什麼」,讓他們掌握技能。
然而,很多技能現在已經可以由 AI 代替,或者可以透過指揮 AI 來完成。那麼,在這種情況下,我們自己應該做什麼?這成為一個非常重要的問題。其次,我們當前的許多工作本質上是一種「縫合」工作——將各類資訊複製、拼接、整理,最後形成一份報告。但 AI 在這方面已經比人類做得更好。因此,我們要思考自己的內容是否能為人類或整體知識體系增添獨特價值。
就像我們現在的對話,可能也有「縫合」的成分,但至少可以誕生一些獨特的資料。那麼,我們的工作能否創造出 AI 訓練資料中不存在的獨特資訊?還是僅僅在重複 AI 已有的內容?這一點對教育和工作的本質都會產生重大影響。
Q:馬斯克那句話我覺得特別有意思,簡而言之就是:「我想在火星上死去,但不是在著陸時。」
戴雨森:對,關鍵是別撞死。
Q:我有一個比較個人化的問題。你最近在做投資,同時也即將學習 HI(Human Intelligence),還在研究二級市場。面對這麼多領域,你如何保持高效的學習速度?
戴雨森:也沒有特別快,否則我早就更深入地研究 DeepSeek 了(笑)。其實在 V3 釋出的第二天,也就是 12 月 27 號,我就在家裡組織了一場討論會,邀請了十幾個朋友,包括位元組和各個 AI 研究機構的朋友,一起探討 AI 領域的最新進展。當時正好有 DeepSeek V3 的釋出,非常振奮人心。這說明我們的學習能力還是不錯的。
比如 MLA 釋出的第二天,我就覺得它非常厲害。當時我在美國,和朋友們討論這個技術。我認為興趣非常重要——只有真正感興趣,學習才會更有效。我自己也比較「多事」,比如 ChatGPT 釋出當天,我就用到了凌晨四點,覺得這個技術完全不一樣。這種習慣可能源於我 1998 年開始上網,1999 年第一次使用 Google。當時的搜尋引擎很弱,幾乎搜不到有價值的資訊,而 Google 的搜尋結果完全不同,給我帶來了極大的衝擊。
類似的經歷還有很多,比如校內網上線的第二天我就開始使用,後來對整個網際網路創業的發展有了深刻的印象。ChatGPT 釋出後,我第一時間體驗,並立刻組織研究小組。Devin 也是如此,我覺得它很有潛力,於是馬上組織討論。
回顧歷史,網際網路的第一批創業者往往是最早上網的人,移動網際網路的先行者通常是最早買 iPhone 的人,甚至最早賺錢的特斯拉投資者,也是因為他們最早購買了特斯拉。因此,現在願意花一點小錢甚至不花錢去體驗未來,仍然非常重要。比如 Devin 訂閱費是 500 美金一個月,乍一看不便宜,但對於朋友圈的投資人來說,可能只是喝一瓶茅臺的價格,而這點成本可以幫助我們提前看到未來的趨勢。
Q:確實。
戴雨森:所以最重要的是多動手實踐,主動去閱讀 paper,關注頂尖研究者的工作。比如 OpenAI、DeepSeek 以及其他前沿機構,他們的高質量資訊大多是免費公開的,值得學習。去年年初,二級市場很多人認為 AI 需求會遇到瓶頸,2025 年行業可能會下滑。但我從行業內部的觀察來看,完全不是這樣。AI 訓練仍然在加速,軍備競賽的趨勢明顯,各家公司都在大規模採購算力。我在去年下半年開始投資 ASIC,當時的邏輯是,儘管 ASIC 未來可能很重要,但短期兌現度還不高。類似的故事在行業內屢見不鮮,比如早年 AMD 被認為會挑戰英偉達,如今 ASIC 也被認為可能威脅英偉達。
Q:ASIC 其實已經衝擊了英偉達好幾次,當年 5G 時代的一些公司就是 AC 公司的代表。
戴雨森:是的,每次看似會有衝擊,但最終影響有限。不過二級市場往往是「先炒再說」,兌現情況並不一定重要。二級市場的一個有趣之處在於,它可以作為一種驗證認知的工具。比如,我很早就知道 DeepSeek 很強,但他們並不需要外部投資。這種情況下,二級市場就提供了一個「投注」的機會,就像訓練模型需要 reward signal 一樣,市場的反饋可以驗證你的思考是否正確。因此,我認為二級市場真正的價值不是賺錢,而是提供一個不斷檢驗和修正認知的機制。
Q:那你現在如何利用 AI 工具進行投資決策?
戴雨森:Deep Research 給了我一個很具體的案例。前陣子特朗普每週五都會發布新的加關稅政策,當時我正在研究美國國債的交易走勢。我向 Deep Research 提問:「2018 年特朗普宣佈加關稅時,美國長期國債利率的反應是怎樣的?」
當時我有兩種推測:一是加關稅會推高通脹,長期通脹預期上升,導致國債利率上漲;二是市場避險情緒增強,投資者會賣出股票,轉而買入國債,導致國債利率下跌。Deep Research 在 5 分鐘內就給出了分析,指出 2018 年的歷史資料表明,每次特朗普宣佈關稅政策,美國國債利率都會下降,市場傾向於避險。這一分析幫助我做出了買入美國國債的決策,最終證明是正確的。
Q:這確實是 AI 賦能決策的好例子。
戴雨森:是的,我問它一個問題,五分鐘就能得到答案。如果換作是我的助理,或者一些二級市場經驗豐富的朋友,他們可能要到第二天才能告訴我「會漲」之類的。在金融市場,快速響應真的很重要。
Q:你剛剛提到學習,似乎你對 AI Agent 有很強的興趣?
戴雨森:對,我特別喜歡讀書,這也是為什麼我經常講 Agent。我確實覺得它們極大地改變了我的生活。我有時讀書會遇到一個很有趣的觀點,想要深入研究,但如果自己查資料,可能會花很多時間,甚至影響讀書的節奏。
我舉個例子,Reid Hoffman 的新書《Super Agency》裡提到了美國 GPS 發展的歷史。美國最初擔心 GPS 精度太高會影響國家安全,所以人為地加入了 100 倍誤差,導致它只能用於非常粗放的應用。但後來美國發現這樣反而限制了 GPS 的商業價值,於是克林頓政府最終取消了這個限制,使 GPS 徹底開放,也催生了美團外賣、滴滴打車等一系列應用。
這個例子讓我想到 AI 技術的發展:到底是要以國家安全為由限制它,還是選擇開放、共贏,構建生態?於是,我讓 Deep Research 幫我研究 2018 年 GPS 開放政策的背景,並與當前 LLM 政策做對比分析。這種情況下,如果我自己查資料,可能一個小時就過去了,而我只需要讓 Deep Research 先做著,我可以繼續讀書。等它整理完,我再看總結。
最終,我發現 GPS 開放的關鍵在於,美國開發了定向遮蔽 GPS 訊號的技術,這樣在戰爭時期可以區域性關閉 GPS,而平時可以開放使用。這也解答了一個關鍵問題:美國政府如何在開放 GPS 的同時,解決國家安全的顧慮?這個過程如果讓我自己研究,可能要花很久,但現在 Deep Research 就能幫我完成。這也是為什麼我願意為它付費——從時間價值的角度來看,絕對是划算的。
Q:200 美元一次,你覺得完全值得?
戴雨森:當然值得啊,200 美元買一次研究,平均到每次 2 美元。這種價效比太高了。
Q:你有沒有一些其它書籍推薦?
戴雨森:我特別推薦一本書,叫《A Brief History of Intelligence》。這本書的作者是一位科技創業者,他從地球生命的起源講到 GPT-4,總結了智慧演進過程中的五次關鍵突破,並分析了每次突破的驅動力以及由此帶來的影響。這是我 2024 年的年度推薦書目之一。
我還推薦給 OpenAI 的研究員,他們讀完之後也覺得很有啟發。這本書不僅能幫助我們理解智慧的演化,也讓我們意識到——我們可能正站在第六次大爆發的前夜,甚至已經進入了這個時代。
Q:還有其他推薦嗎?
戴雨森:有一本更專業一點的書,叫《第一隻眼》。它講的是寒武紀生物大爆發的歷史。地球上生命存在了 20 億年,但一直是鼻涕蟲一樣的軟體動物。然後在寒武紀的幾百萬年裡,生命突然演化出了多個門類,生物多樣性大爆發。
為什麼會發生這樣的進化?有很多理論,比如空氣含量變化、海水成分變化等等,但這本書提出了一個「光變假說」,認為正是因為某些生物偶然進化出了感光細胞,它們可以感知光線,獲得了生存優勢。隨著感光細胞越來越多,最終演化出了真正的眼睛。而當第一隻眼睛出現時,整個生物圈的競爭格局發生了鉅變,捕食者變得更強,被捕食者也進化出了保護機制,比如甲殼或者更敏捷的運動能力。
這個理論讓我聯想到 AI 發展的現狀。DeepSeek 釋出等一系列進展,讓我覺得 AI 也處於類似的「寒武紀大爆發」階段。當競爭變得激烈,所有人都必須快速前進,才能不被淘汰。這就像《愛麗絲夢遊仙境》裡的紅皇后假說——「你必須拼命奔跑,才能留在原地。
這種競爭推動了技術進步,使 AI 發展得越來越快。但從進化的角度來看,這既是生存競爭,也是智慧發展的必然結果。
Q:剛才你提到智慧的演化,語言的作用是不是也是其中之一?
戴雨森:對,語言其實是智慧演化中相對晚期才出現的特徵,它是一種高度濃縮的資訊表達方式。現在的 AI 主要是基於語言模型進行訓練,因為語言本身包含了極高的資訊密度。
但這也引發了一個問題:如果 AI 真的足夠聰明,它是否會重新發明一種語言,而不再侷限於人類的自然語言?劉慈欣的某部科幻小說就提到,外星文明可能會認為人類用語言交流是極低效的方式。
所以,現在 AI 主要依賴語言模型,但未來也許會超越語言。AI 的思維速度遠超人類,如果讓它繼續使用人類的語言,它可能會受到表達方式的限制。回顧智慧演化的歷史,有助於我們理解 AI 未來可能的發展方向。
Q:你提到了強化學習(reinforcement learning),它在智慧演化中是怎麼起作用的?
戴雨森:這本書也探討了強化學習的起源,並透過大量進化生物學的案例進行分析。我覺得這些研究對 AI 領域有很大的啟發。
Q:非常感謝雨森做客。今天我們從 o1 和 R1 這兩個關鍵進展聊起,討論了它們對 AI 格局的影響,以及隨之而來的變革。2025 年,或許我們會迎來更多 AI Agent 的 PMF 突破,以及更多「李世石時刻」的到來。
戴雨森:謝謝邀請,我也期待 2025 年的 AI 發展。我們還處在 AI 智慧革命大爆發的第一天,未來一定會有更多驚喜!
推薦閱讀


相關文章