用聲音,聽見真格。
「此話當真」是一檔泛商業類播客,我們希望搭建這樣一個分享和交流的平臺,讓每一個對商業、科技、創投充滿好奇的人都能在這裡有所收穫。每期播客將會由不同的真格投資人擔任主持,和各領域的領軍人物一起帶大家深入瞭解科技趨勢,以及創新技術的影響力。交流科技熱點,我們只想給你最專業的解讀。
當然,我們希望這不僅僅是一個播客,更是一次創業的探索。真格,你的創業第一站!我們期待與你相遇,一同發現新的可能。
2025 年第一期,是「此話當真」與「十字路口」的串臺節目。站在新年年初的時間點,雨森和 Koji 最近都很興奮,因為感到正在親歷科技史上一個重要時刻。這種感覺源自兩個重大事件的發生:一是 Devin 的公開,二是 OpenAI o3 模型的釋出。
Devin 為何如此令人興奮?就在半年前,雨森在做客「十字路口」時曾打過一個比方,「大模型還是小學生,彆著急讓它去打工。」而就在親自體驗過後,雨森認為,Devin 作為第一個真正能用的 Agent 產品,讓人們看到了工作的 Scaling Law。從「你問我答」到「你問我做」,在 AI 能夠非同步自主完成計劃與執行後,擺在每個「人類」面前的新問題已經變成:如何學會當 AI 的老闆。
本期內容,在深度探討 Devin 的使用感受與技術飛躍以外,我們回顧了過去一年 AI 行業的快速發展,並想象著 2025 年屬於 AI 創業的大機會將是什麼。
新年宜暢想。AI 技術的發展波濤洶湧,然而只要深入其中就能看到,令人驚歎的進步總髮生在一次次具體而微的努力中。新的一年,就讓我們繼續滿懷期待,且看這滔天巨浪,將帶人們駛向何方。

01
2024 回顧:AI 技術爆發,模型進步超預期,應用增長顯著
Koji:我們先來問雨森的第一個問題:2024 年這一年下來,你的整體感受是什麼?
雨森:非常高興能夠跟 Koji 再次合作,分享我們對 AI 發展和投資的感受,和大家有機會交流。
2024 年這一年下來,整體感覺我覺得是一個字,「快」。因為我們看到 AI 的模型以及產品的迭代速度都很快。
我記得在 24 年年初時,最先進的模型是 GPT-4。那個時候有個新的基準測試(Benchmark)叫 SWE-bench,是把 GitHub 上常見的任務型別拿下來讓 AI 去嘗試完成。當時最先進的模型 GPT-4 在這上面的得分是 2.8 分,滿分是 100 分。到 24 年年底時,大家可以用到的 Sonnet 3.5 能夠得到 50 分,也就是能解決一半的任務。而剛剛釋出的 o3 在初步評測裡已經得了 71.7 分。
樂觀來講,以這個速度在一年的時間內,也就是 25 年,我們就可以看到人類絕大部分 GitHub 上的任務都能被 AI 解決了。這也意味著現有程式設計師的單個任務,雖然不是整體工作,但確實有很多都可以被解決。24 年年初時,ChatGPT 還不太會做四則運算,那時候大家經常考它三位數乘三位數,它可能也會算錯。但現在解答 IMO 級別的題目已經得心應手,甚至在對數學家來說都很難的 Frontier Math 測試集上,o3 也得到了 25 分的成績。這是陶哲軒背書的,他認為這些題目簡單的是 IMO 級別,難的是前沿研究級別,現在 AI 也能做得不錯。
Koji:這對應用帶來了哪些影響?
雨森:比如我們投資的 Kimi,他們的產品是 23 年 10 月 9 號,差不多在 24 年開始前一點時間上線的。到 24 年年底已經有 4000 萬月活使用者。考慮到它是一個一年左右時間的新應用,這個使用者增長速度非常快。
我還記得在 24 年 2 月份春節假期時,看到 Sora 的釋出宣傳片覺得非常震撼。當時想著產品要過多久、以什麼樣的成本才能用到這樣的影片生成模型。但在 24 年底時,大家已經可以用上了。像可靈、混元等一系列產品,包括 Google 也出了 Veo 2,都是比當時的 Sora 可能更好的影片生成模型,而且是免費的,讓大家覺得不過如此。所以大家對於 AI 產品的標準提高很快,一年前讓人驚歎的東西,現在可能就覺得平常。但我們始終覺得還有更多可以做的事情,還有很多東西沒落地,實際上進展是非常快的。
同時我覺得也有很多觀點和看法被打臉。我記得在 24 年開始時,如果你去問中國的投資人、創業者,很多人都要做中國的 Character AI,當時大家都覺得這好像是一個 To C 應用,又有很多人用,還說要「百 C 大戰」。
Koji:年初很多人預測 2024 年一定會發生的一個趨勢是 「百 C 大戰」。
雨森:反正我沒有那麼預測,但有很多人這麼預測。在 24 年 8 月份,Character AI 就宣佈被 Google 收購,大家發現要破圈也不是那麼容易。3 月份,Cognition 這家公司,也就是 Devin 的開發者,他們發了一個 demo 影片。那時候大家都不相信,覺得這個公司是忽悠人,甚至有人說是騙子,還有打假的影片。結果 12 月 Devin 這個產品出來,大家大為震驚,發現居然是真的,可以做到很多 AI 的功能。
我還記得在 23 年年底 OpenAI 的宮鬥事件,那個時候整個 OpenAI 的員工都集體在 Twitter 上發聲支援 Sam Altman,說「OpenAI is nothing without its people」,是刷屏的內容。但到 24 年底,走了不知道多少人。最後連元老 Alec Radford,OpenAI 的核心研究員也走了。那中間基本上大部分早期員工都走了。包括在年初時,大家覺得 GPT-5 很快要出來,但一直到年底 GPT-4.5 也沒有出來。等來的是另外一條路線,就是 o1、o3 這條在推理(Inference)的路線。
一年下來有很多變化,不管是快速的變化,還是很多讓人想不到或沒有預計到的變化。這可能就是一個行業早期變化的常態。
Koji:半年前在十字路口那期播客裡,雨森有一個核心觀點是說「大模型還是小學生,不要急著讓它去打工賺錢,給它多一些耐心。」
說這句話的時候,背後暗示著認為技術的進步雖然很快,但離商業化還很遠,離 To C 的大規模應用還很遠。在今天你還是這麼認為嗎?還是你覺得進化的速度比你當時理解的要快?
雨森:首先當時說這句話其實有一個上下文,就是大家在問「訓練模型花了這麼多錢,什麼時候才能賺回來?」在討論訓練模型投資回報週期時,我覺得這符合每次技術革命的相似模式:先投入資金進行基礎建設和科研,然後產品逐漸找到落地場景,最終產生商業化收入。
那麼一年下來,在一些具體模型能力比較擅長的具體領域,比如程式設計領域,大模型的能力確實已經超過了可以「打工」的閾值。就像我之前提到的,在 SWE-bench 測試上,年初只能解決 2% 的問題,顯然還無法勝任工作,但現在已經能解決 50% 的問題。尤其是在 ChatGPT 3.5 出現後,我們看到像 Cursor、Windsurf 以及 Devin 這樣的產品開始湧現,它們能夠真正幫助程式設計師解決很多問題,為生產力帶來實質性提升。
從收入角度看,一些 AI Native 應用在找到產品市場契合點(PMF)後增長迅速。比如 Cursor 現在的年度經常性收入(ARR)已接近 1 億美元。另一家針對技術小白使用者的 AI 程式設計公司 bolt.new,在四個星期達到 400 萬美元的 ARR、兩個月內達到了 2000 萬美元的 ARR,這是企業服務應用有史以來最快的增長。還有斯德哥爾摩的一家公司 Lovable 在四周內就達到 400 萬美元的年化收入。
包括我們投資的 AI 應用 HeyGen,在 23 年年中拿到 1M ARR,在 18 個月內增長了幾十倍,24 年年底達到近 50M ARR。我們投資的 Monica 也已超過千萬美元的 ARR,這些都是在短短十幾個月內實現的。無論是海外創業公司還是我們投資的專案,在使用者增長方面都取得了顯著進展。比如前面提到的 Kimi 已經擁有 4000 萬用戶。
我認為,在某些領域 AI 已經具備了「打工」能力,但整體收入仍遠低於成本。我們需要保持耐心,畢竟 ChatGPT 問世也才兩年。我們仍處在一個模型能力不斷提升、解鎖新應用場景的階段。只有在應用場景產生足夠多的價值之後,才能逐步開展商業化。
Koji:其實我覺得這一波技術擴散的速度非常快。剛才提到的 Cursor、bolt.new,包括 HeyGen 和 Monica,除了 Monica 因為肖弘送了我 VIP 會員,另外三個我都是付費使用者。這些技術擴散起來,我覺得比上一波更快。即便它們並沒有網路效應,但今天有一幫非常熱情的技術前沿探索者,大家在不斷嘗試新事物,並且熱情洋溢地去傳播。其實十字路口也是這樣的一員,我和雨森每次用到什麼興奮的東西,也都會第一時間分享。
我有一個強烈的感受,也是我們錄這一期的原因,就是希望讓大家不要隔岸觀火,不要覺得看到的只是各種版本號的新發布,好像對自己沒什麼影響。我特別希望大家能夠跳到浪潮裡面去,下載這些應用體驗一下,早一點感受,早一點用起來。
雨森:我覺得有一句話說得特別好,是科幻作家 Gibson 說的:「未來已經到來了,只是沒有均勻分佈而已。」如果日常只是用一個簡單的 Chatbot,甚至還有很多人都沒怎麼用上 AI 產品,那可能就覺得這都是一些新聞頭條而已。但在某些特定領域,比如對程式設計師或者數字藝術創作者而言,我相信很多時候 AI 工具已經成為他們生產中不可或缺的一部分。我一直覺得,花一點時間或者花一點小錢去體驗最新的 AI 產品,是非常值得的。因為這是一個很好的方式,可以直觀感受到我們在某些領域的進步,也是看見未來的一個好辦法。
02
AI 技術擴散:如何讓人人都能創造,而不只是使用
Koji:剛才提到不管是數字藝術創作者還是程式設計師這兩個群體應用的大規模進步,我認為它們的意義並不僅僅是在幫助這兩個群體。更重要的是在幫助普通人也能夠去做原來只有程式設計師和藝術創作者才能做的創造,這才是更大的意義。
我們再說回來,雨森你去年在真格大概聊了多少個 AI 應用的創業專案?有什麼整體感受?你覺得 AI 應用落地的速度在加速嗎?
雨森:我們團隊加起來應該聊了上千個 AI 應用的創業專案,我自己大概接近 200 個創業者。我們確實覺得隨著技術的進展,AI 應用的落地速度在加快。
具體來說,我覺得三個進展很重要:
第一個是模型的推理能力。像 GPT-4o、o1 這類的釋出讓模型的推理能力變強後,它的幻覺會減少,所以可以去規劃和完成更加複雜的任務。
第二個是模型的程式設計能力提高。因為在數字世界,大量任務可以透過編寫程式來完成。我們開始也提到,程式設計能力的增長速度非常快。當這些常見任務能夠被程式設計解決的時候,至少在程式設計這個領域,以及可以被泛化為程式設計的其他領域,執行任務能力會強很多。
第三是 Anthropic 首先提出的工具計算機使用(Computer Use)。AI 能夠使用我們已有的軟體,從瀏覽器開始到其他軟體。人類社會造的這些軟體都可以被 AI 用來解決任務。所以這幾個加起來,我覺得對於 AI 完成任務的能力提高很多。
我覺得在 2025 年,Devin 的釋出很重要,因為它是第一個把 Agent 從大家的想象、從原型變成現實落地的產品。我們會很快看到各個領域的 Agent 嘗試都會出來。當然很多還是在比較初級的階段,但我覺得會有很多很有意思的思考得以落地。
Koji:所以我們待會兒會花很大的篇幅來和大家聊 Devin,以及聊我們對以 Agent 為代表的 AI 在明年發展的一些預期。
雨森:我們看到在美國和中國,AI 應用的創業方向是挺不一樣的。在國內由於企業服務落地還是有些難度,導致很多創業者想做的還是 To C 的應用。而 To C 應用裡面,很多都傾向於做殺時間的應用,比如各種情感陪伴、AI 聊天這樣的變體。在美國我們看到的是各個細分領域,大家都在想去替代部分人類的工作,讓工作變得更加降本增效。這是中國和美國創業方向的很大反差。
當然國內還有一個大方向就是機器人,整個具身智慧領域有非常多的新公司出來,拿了很多融資,甚至我們覺得有點過熱。但整體來講,我覺得大家還是非常興奮的。尤其是對年輕創業者來說,因為之前大家可能覺得網際網路時代已經快結束了,我們 80 後都是網際網路時代的紅利獲得者,但是 00 後可以幹什麼呢?AI 沒興起之前,他們覺得在網際網路領域確實沒什麼可乾的。但現在 AI 讓大家看到了很多新機會,也是屬於他們這一代年輕創業者的機會。所以我們作為一個始終關注年輕人的基金,還是覺得有很多有意思的創業者在出來,有意思的專案也在出來。
Koji:說到這一波的創業者,你覺得他們身上有哪些典型的共同點嗎?除了對年輕更友好之外?
雨森:年輕是隨著不同時代進展必然具有的特點。
他們普遍更加具有國際化視野。資訊傳播現在越來越快了。在網際網路時代,海外一個應用火了,中國可能要過個三到六個月才有對標的產品出來。而現在基本上海外出現什麼新事物,當天就會有新聞報道,很多還是透過 AI 去總結翻譯的。所以大家對模型海外應用的進展普遍都很瞭解。
同樣,因為做的產品往往都是國際化的,出海也成了很大的主題。本來模型就具備很強的多語言能力,所以不少一開始做產品就是全球化的。這個在網際網路時代比較難以看到,那時大家往往都是說「我就做一個針對中國市場的產品」。而現在大家一開始就是兩條路一起走,既有國內的也有國外的。我看到很多創業者和團隊也更加 AI Native,不少人都有做 AI Research 或者工程實踐的經驗,這也是他們能夠更早看到機會並把機會落地實施的原因。
但同時,我覺得對於年輕的創業者來說,因為他們可能沒有經歷過網際網路很多業務的流程,所以在推廣、做商業化這些領域有些課需要補。在這個時候,一些老司機,比如像我們投資的 Monica 這樣的團隊,他們之前經歷過很多網際網路領域的增長,所以這方面的經驗確實有一些優勢。但我覺得這些都是可以學習的,並且也可以透過招人、透過團隊的補充來提高,所以我們在這方面還是長期很有信心。我們相信新一代 AI Native 的創業者能夠做出很有意思的產品,並且在該補的課上也能補回來。
Koji:我們接下來聊一聊從去年到今年,整個 AI 的技術突破、行業變化和創業機會在這些方面認知上的變遷。首先想問的是,有哪些觀點是一年前你還蠻認可,但一年之後你自己已經不再認可的?
雨森:我覺得太多了,所以後來我都不太想錄播客了,因為每次講了就容易被打臉。但要做早期投資,尤其是看早期技術,打臉是常態,只有不怕打臉才能夠繼續學習成長。
一年多以前,大家強調的都是 Pre-training,大家講的都是說你需要有多少顯示卡、要有多大叢集,這也是 NVIDIA 股價暴漲的原因。因為大家簡單地把它理解為:你有更多的顯示卡、更多的算力,丟更多的資料進去,很好的模型就會出來。
到 2024 年底 2025 年初來看,在 Pre-training 上確實從 OpenAI 以及各個行業領先團隊來看,已經到了一個相對的瓶頸。
如果我們說 Pre-training 是對智慧的壓縮,那現在以文字等這些形式容易被壓縮的智慧已經壓得差不多了。Ilya 在發言時說,「網際網路的這些文字就像化石燃料,是人類這麼多年積累下來的文字,現在已經被我們都訓練到模型裡去了。接下來就需要新知識,不管是在我們腦子裡面還沒被提取出來的知識,或者是透過 AI 去產生的新知識,這樣的知識增長速度其實沒那麼快。」所以我覺得 Pre-training 大力出奇跡,這是今年大家都意識到要發生改變的一個過程。
一年前我確實也聊到一些 Agent 的內容。當時我覺得在大模型普遍存在很多幻覺的情況下,這種自主智慧體(Autonomous Agent)或者說 L4 級別的 Agent 落地時間會需要比較長。但目前來看,模型的推理能力、程式碼生成能力和工具使用能力確實進展很快。這使得在數字世界裡面,如果我們對於一些目標結果比較確定的任務,比如說程式設計,Agent 落地的速度確實變快了很多。我們已經看到像 Devin 這樣的產品已經不只是一個想法,而是成為了事實。
這裡面有兩個要點:一是如何更好地規劃任務,能夠做更長週期的任務;二是使用工具,包括寫程式碼去使用和用已有的工具。這兩個能力都變得很強的時候,Agent 的落地速度可能會比大家想的要快,尤其是在數字世界裡面。
第三點是,一年前大家普遍認為模型會越來越大,之前說是 7B、70B、甚至 700B。但目前來看,先進模型的大小提升其實不用那麼快。我們可以用 70B 的模型得到越來越好的結果,同時我們也能夠把同樣的能力放在更小的模型上去執行。
實際上,這種真正的超大模型可能主要用於對使用模型的對齊,或者說作為 Teacher Model(教師模型)。這其實有點像最早個人電腦的時代。大家一開始都覺得 CPU 的處理器頻率要越來越高,但實際上到了 3GHz 之後,單核頻率就不怎麼單獨增長了,而是透過更好的架構、更低的能耗去提升效能。就像人的大腦一樣,不是要越來越大,而是在同樣的大小下,學到更多知識和技能,變得更加聰明。在這方面,我覺得模型成本的下降是超出預期的。雖然大家一直都知道模型的成本會越來越低,但現在我們看到每年同樣的模型或同樣的智慧,它的成本能下降到原來的十分之一。這會解鎖很多應用機會,這些都是在 2024 年初時大家可能沒有那麼明顯意識到,或者說在過程中發生改變的觀點。
Koji:還有一個關於認知變遷的問題:有沒有哪些是你在 2024 年初覺得值得關注但沒那麼重要,但到今天卻變成了特別重要的認知?
雨森:我覺得首先作為投資人,我們對於前沿研究的認知往往是有些滯後的。有些事情可能在研究員群體中已經形成共識,但我們還處於後知後覺的狀態。
2024 年有個重點,就是強化學習(Reinforcement Learning ,RL)的興起。前面提到 Pre-training 已經到了一個瓶頸,而在 Post-training 裡面透過 RL 讓模型能力持續變強,尤其是在 o1 和 o3 釋出之後,大家發現在 RL 這條路上還可以走很遠,模型的能力可以提高很多。在 2024 年初的時候,這一點其實還只在很小的範圍內討論,還沒有成為業界甚至研究界之外的普遍共識。所以我們發現預測大模型或者 AI 的技術路線永遠是一件很難的事情。RL 這個方面的人才其實也很稀缺,所以大家都在做這樣的團隊建設和技術儲備。
與此同時提出了一個非常重要的 Scaling Law,就是推理擴充套件定律(Inference Scaling Law):如何把推理時間延長,得到更好的結果。
這在去年是一個非常重要的進展,不僅體現在模型的設計上,也包括我們如何設計產品。因為現在大部分產品像 ChatGPT、Claude 或者像 Cursor 這樣,都是要跟人進行即時互動,我說一句它回一句。那這個時候,如何讓它每一步能夠做更長的時間,甚至讓它自己能夠透過計劃使用工具持續地去做事情,而不需要我持續輸入。這種「慢思考」的思維方式不是張口就來,而是經過深思熟慮之後得到更好的結果。這方面如何獲得更好的表現會是今年非常重要的一點。
還有一個是,模型之前是沒有太多背景資訊的。比如當我問 ChatGPT 一個問題,它實際上只有我的這個輸入作為它的背景資訊。事實上任何一個聰明人,如果只有一句話來回答問題,都是很難的。但我們現在看到,比如 Cursor 可以把整個組織的 Codebase 作為背景資訊。而 Devin 是整合在 Slack 裡邊,它能把組織里面已有的對話記錄、功能記錄作為背景資訊。當模型在同樣的智慧水平下,有了更多的資訊,就能夠更好地理解意圖,更好地回答問題。
我覺得在這個方面,新的產品設計如何讓使用者能夠無痛、簡單地把更多背景資訊帶進去,會變得很重要。所以我們現在看到的像 ChatGPT 這種一問一答的方式,我覺得還是一個非常原始的方式。大家都在思考新的產品形態是什麼樣子,這些都是今年大家逐漸意識到並浮出水面的東西。
Koji:我們在上一期的「十字路口」里正好聊到了 OpenAI 過去 12 天的連環釋出會釋出了什麼。關於前面提到的第三點,即如何獲得更多的背景資訊,OpenAI 也釋出了一個新功能:ChatGPT 的 Mac 版本現在可以讀取你的螢幕,把螢幕上的內容作為背景資訊,結合你的問題來給出回覆。
這個讀屏功能並不是簡單的截圖,它可以讀取三個層面的內容。第一個層面是截圖式理解,即螢幕上顯示什麼它就理解什麼。第二個層面是它可以讀取程式窗口裡的所有內容,哪怕這些內容現在並沒有顯示在螢幕上,需要滾動才能看到,它也可以獲取這些資訊。第三個層面是最厲害的,它可以知道你的游標位置。因為游標在哪裡,往往表明你當前的注意力最集中在哪裡。因此當你問問題或與它討論時,它會結合你的游標位置或你選中的文字來進行回覆。
所以我覺得哪怕是在 Chatbot 這樣的模式下,能讀取更多背景資訊的應用也會讓 AI 能力變得更強。
雨森:對,原來的 ChatGPT 有點像是你的一個筆友,你只能給它寫郵件,你寫一封它回一封。但如果這個「筆友」不是在郵件的另一端,而是站在你電腦後面,看著你如何使用電腦,甚至是住在你的電腦裡面,能看到螢幕上看不到的東西,它顯然會變得更有用。
所以我覺得如何把 AI 與使用者的背景資訊、使用者已有的知識、組織已有的知識結合起來,對 AI 的作用是巨大的。因為它現在能夠消化這麼多的資訊,這當然也得益於模型技術的進步。
Koji:不僅是這些,最近剛釋出兩週的 Gemini 2.0 也推出了多模態理解功能。你可以直接開啟攝像頭,然後指著攝像頭看到的東西問「這是什麼」。比如我試了一下,就問牆上一張電影節的海報:這是什麼電影節、哪一屆的海報。類似這樣的問題在過去都只存在於科幻電影中,但在今天已經變成現實,而且這個現實是在可接受的成本之內,並且能以非常快的速度返回答案。當然它還沒有特別好地變成一個 C 端產品,但大家去試用一下,我覺得這個效果真的很讓人驚豔。
03
從 ChatGPT 到 Devin:AI 程式設計的四個發展階段與正規化轉變
Koji:我們再聊一聊 AI 程式設計。程式設計領域今年取得了非常令人興奮的進展。雨森一直有很強的框架歸納和總結能力。前不久你跟我分享過你提煉出來的 AI 程式設計發展四段論,要不要在播客裡和大家分享一下?
雨森:這其實是和很多朋友一起探討得出的結果,是大家智慧的結晶。AI 程式設計從 ChatGPT 出現到現在也就兩年出頭的時間,但已經經歷了四個階段。
第一個階段是讓 AI 直接寫程式碼,典型代表是早期的 ChatGPT、Claude。我們給它一個需求,比如「幫我寫個貪吃蛇」,它就給出一段程式碼。在這個過程中,它既不知道我為什麼要寫貪吃蛇,也不知道程式碼執行情況如何。可能要我去本地編譯執行後發現報錯,再把錯誤告訴它,它才能給出除錯後的結果。這時的 AI 完全就像一個只能透過郵件交流的筆友,是簡單的問答模式。
第二階段是以 GitHub Copilot 為代表,AI 開始擁有上下文,它可以把整個組織的程式碼庫作為 context。這樣 AI 就獲得了大量新的背景資訊。但這時使用者還是需要手動把程式碼貼到 IDE 裡面進行除錯。我覺得這是 2.0 階段,就是我們讓 AI 擁有了 codebase 作為上下文。
2024 年一個非常大的進步是以 Cursor 為代表的程式設計 Copilot 的出現。它的核心理念是預測使用者未來要寫什麼程式碼。根據你的程式碼庫以及剛才寫的程式碼,它預測你接下來要寫什麼程式碼、建立什麼檔案、做什麼操作。這裡面對於生成程式碼的質量和數量,以及檔案的建立和修改都有很大提升。後來 Windsurf 還加入了對命令列操作的自動化,這樣 AI 就能很好地使用我的電腦。原來的 AI 是在一張紙上寫程式碼,我把程式碼抄走執行;現在 AI 可以在我的電腦上建立檔案、執行命令列操作,進入到「我為你寫」的階段。
當我們覺得這已經很令人興奮時,Devin 的出現帶來了幾個重要突破:首先,它可以非同步工作。Cursor、Windsurf 這些工具雖然一步操作做的事情比較多,但仍然需要持續的注意力,即「我說一步它做一步」。而 Devin 可以持續工作,把使用者的注意力釋放出來。這是因為它多了一個 Planner,可以規劃任務。
其次,它可以透過虛擬機器執行更多操作,做更多除錯工作。比如你寫個網站,它可以自己用虛擬機器去訪問這個網站,檢查前端後端的業務邏輯是否正確,並且可以隨時打斷和調整。大家用 Cursor 或者 ChatGPT 都知道,你無法在它輸出的中間做調整,必須等它輸出完後才能修改。但 Devin 就像真人一樣,你可以在它完成任務時給出新指令,它會把這個結合到已有的 Planner 裡調整計劃。這就從「為你寫」進化到了「為你做」。
總結一下這四個階段:第一階段是讓 AI 寫程式碼,代表是 ChatGPT;第二階段是 AI 開放程式碼庫,代表是 GitHub Copilot;第三階段是 AI 可以自動寫程式碼並執行,代表是 Cursor 和 Windsurf;第四階段是 AI 虛擬員工,Devin 開創了一個很好的先例。
04
AI 出海攻略:深耕使用者需求,巧用內容營銷,避免簡單投放
Koji:這很像一個比喻:1.0 時代的 AI 是「讀萬卷書」來回答問題,到了 4.0 時代則變成了「行萬里路」。它成為一個真實的員工,你給它下達任務,它就去外面完成一圈,再回來向你彙報。這是我們親眼見證的、在這一年中發生的躍遷式四階段變化。
真格在過去投資了不少出海的 AI 創業團隊,其中非常典型的代表是 HeyGen 和 Monica,都表現得超級優秀。所以也想和你探討一下出海的話題。
今年在整個行業裡有一句廣為流傳的說法是「不出海就出局」,出海似乎變得非常重要,甚至是至關重要。所以首先想問你的是,為什麼海外 AI 的落地和國內的反差這麼大?以至於我們都鼓勵英語都說不好的國內創業者去勇敢嘗試,做一做 AI 的出海?
雨森:最核心的原因是 AI 目前主要是一個提高生產力的技術,而在人均工資高很多的歐美地區,他們對工具的付費意願更強。
所以當你做一個生產力工具時,比如像我們投資的 HeyGen、Monica 還有 Oculus、Max AI 等一系列提高生產力的工具,海外使用者尤其是歐美使用者對於生產力付費的意願比較強,而且他們付的是美元,所以這個絕對金額更高。這是最重要的因素。
同時也有一些其他原因:比如說去海外能夠使用能力更強的模型,如 Sonnet 3.5 或者 GPT-4o,所以能夠解鎖更多的應用場景,而國內大家能用到的模型確實還有一些差距。另外,當一個產品做好之後,因為大模型本身可以處理多語言的輸入和輸出,既然已經做了,為什麼不把它面向全球化推廣呢?
我覺得現在普遍採用了訂閱制,這在國內確實比較難推行,但是海外訂閱已經被廣泛接受了。這樣對於創業團隊來說,他們做商業收入的能力也提高了很多。
Koji:所以你認為這一代的 AI 創業者,他需要具備哪些特點?然後你會鼓勵他出海嗎?因為我想你也不會鼓勵所有人出海。
雨森:其實我們現在覺得當所有 VC 都勸創業者出海的時候,這往往就說明市場太熱了。
因為我們一直在警惕這種所謂特別共識性的觀點。而且我們覺得大部分中國創業者出海肯定是一個 debuff 而不是 buff,因為畢竟是客場作戰,你要解決很多在國內不需要解決的問題,以及去了解很多原來並不瞭解的使用者。
中國的機會其實很多,像我們在國內投的 Kimi、與愛為舞這些 AI 公司,其實增長得更快。只是說它的商業化可能會稍微慢一點。但是我覺得這也是網際網路時代我們學到的一點。其實想想看網際網路時代,當 eBay 那個時候很早商業化、抽佣金的時候,淘寶先免費,然後最後做成了更牛的商業模式。在中國和歐美市場,本來適合的商業模式就不太一樣,並不是每個團隊都要去出海。
Koji:在今天已經選擇要出海的中國創業者,我相信有很多人在聽我們這期播客內容。那雨森,你會有什麼樣的建議給到他們嗎?
雨森:我覺得出海其實跟在任何地方做產品一樣,首先要非常瞭解使用者的真實需求。在出海的過程中,因為隔著語言和地理位置的障礙,所以這一點變得更加重要,尤其在企業服務領域。因為之前我們見到蠻多中國做企業服務的創業者,覺得我們的工程師能力很強,解決問題的能力很強,所以他們覺得出海可以去超越競爭對手。
雖然我們的團隊執行力很強,但定義關鍵問題需要實地調研和真正瞭解客戶。所以尤其是在這種需要以銷售驅動的領域,我們覺得一定要找到有 Go-to-Market 經驗的專家,甚至團隊要去到對應的目的地。像 Monica 這樣偏使用者端的產品,需求可能相對比較普世或容易理解,那這個倒不一定。但對於企業服務來說,人一定要出去。
當然我們看到有很多做小眾市場的,因為這類需求理解起來最容易,可能全人類都差不多。這是第一點,就是真的要搞清楚使用者和需求。第二點,我覺得普遍做得好的團隊的共性,就是要想清楚並找到一個低成本高回報的營銷策略。比如我們看到 HeyGen、Monica、Viggle 這些中國出海比較好的產品,其實往往都是把 SEO、社交媒體傳播,或者優質內容的病毒式傳播這些營銷策略用得比較好,而不是簡單地去做投放的打法。當然如果你的產品變現能力很強,這個時候也許做投放能把 ROI 算過來,但基本上現在投放都很貴。
所以如何巧妙地做營銷,尤其是透過產品特性實現病毒式營銷,變得非常重要。
把海外的 Twitter 這些平臺用好,其實跟國內很不一樣。因為在國內大家可能習慣了去投資訊流、做投放,透過很厲害的投放方式去做。而在海外我覺得更要巧妙地去做。國內團隊的產品執行力往往都很強,所以無非就是說做什麼和怎麼推廣這兩點,可能是大家普遍遇到比較有挑戰,或者說做好了就會比較加分的地方。
05
AI 硬體創業:看上去很美,但需要謹慎對待
Koji:其實大家還有一個觀點,就是覺得這一波做 AI 硬體的也蠻多的。做 AI 硬體可以特別好地利用到中國的優勢資源。那在 AI 硬體領域,雨森你們在過去一年看過或投資了什麼專案嗎?
雨森:AI 硬體我們看了蠻多專案,但說實話我覺得硬體看上去很美,卻不一定真的那麼好落地。
過去落地比較好的還是這種,比如說海外已經把產品原型打出來了,我們去把它做得更快、更便宜,或者更小。當然我們也看到一些團隊,比如像 Plaud,確實做出了很有創意的產品。但我覺得整體來說,硬體的擴充套件速度其實都沒有那麼快,軟體反而還是更加適合現在 AI 擴散的載體。所以我們對於硬體一直都是比較謹慎的。
當然我們也有投這樣的創業者,但我們整體並沒有像有的基金那樣投了很多。我自己對於 AI 硬體一直覺得,包括像當時的 Rabbit、Humane 剛出來的時候,我自己都是持比較謹慎的態度。
06
Devin:不只是一個程式設計工具,而是首個真實可用的 AI Agent
Koji:好,我們進到今天的第二部分,我們將和雨森一起來聊一聊 Devin。首先要和大家特別說明的是,我們今天會用非開發者的視角來聊。因為我倆都不是專業的工程師,雖然學了七年的計算機科學,但畢業之後就一直做產品經理。也是直到半年前 Cursor 釋出之後,才重新開始寫程式碼,應該說是重新開始命令 AI 幫我寫程式碼(笑)。
但另一方面,正是因為我和雨森都是非開發者的背景,這反而讓我們可以用獨特的視角去感受和體驗 Devin,並且去預測 AI Coding Agent 乃至更廣義的 AI Agent 將如何改變每個人未來的生活和工作。
因為我們認為這一代 AI 程式設計技術最終會沿著兩個方向發展:一個是服務專業的程式設計師和開發者,第二是賦能所有像我們這樣的非開發者。而後者的商業價值和應用前景可能更加深遠而廣泛。
那第一個問題想問一下雨森,我們在釋出的第一天,你其實就花了 500 美金去充值。那你充值了 Devin 之後,第一個用 Devin 做的事情是什麼?以及你用它做的讓你印象最深刻的事情是什麼?
雨森:Devin 在安裝完成之後,它有一些推薦的任務。其中有一個就是它會把你的名字帶進去,在網上找你的資訊,給你做個人網站。之後我讓它做了我通常讓實習生做的典型工作,我給它一個任務:我們要改一改我們的創投基金的價值觀宣言(Manifesto)。然後,我說你去找一找美國有哪些頂級 VC,他們的 Manifesto 是什麼?這是一個典型的任務,你大概知道需要找什麼,但這需要有資訊收集整理和解決問題的能力。
我看它去做,發現很多有意思的點。它首先要確定什麼是美國的 Top VC,所以先去 Pitchbook、CB Insights 這些網站找有沒有 Top VC 的列表。它先找到了它認為 Top 的十幾家 VC,我看了看列表確實是比較頂級的十家,它就一個個去官網找他們的 Manifesto。但是 Manifesto 這個東西在 VC 裡邊其實有不同的叫法。比如說紅杉叫 Ethos,在 Founders Fund 叫 Manifesto,在別的地方可能叫 About 或者 Philosophy。並且還有幾個 VC 的網站上沒有這樣的內容,就是沒有一個關於「我是誰,我的價值觀」的描述。所以我看到 Devin 在這個過程中,它在嘗試理解這個任務,找到最符合的內容。
比如說它在找 Accel 這家 VC(也是美國非常有名的 VC)時,發現官網上沒有這樣的內容。但它就去 News 裡面找,找來找去找了兩三年,他們有篇文章裡面介紹了 Accel 的價值觀方法論。它把那個內容拿出來作為它要找的內容。所以你可以看到它像一個初級人類員工一樣去解決問題,不是很機械地說你網站上有沒有個叫 Manifesto 的東西,沒有就沒找到。而是說我需要去看看你整個網站上面有沒有比較符合這個內容定位的內容,然後去尋找。
它最後給我一個包含 10 個 VC 對應 Manifesto 的 Markdown 檔案,但這裡面有很多 AI 模型現在常見的問題。比如說它有時候容易偷懶,因為我要它把全文拿下來,但在幾個 VC 的內容裡面,它就給自己做了個總結。這是我們很多時候用現在 AI 的 Chatbot 也會遇到的問題,就是因為 Token 數的原因不給你全文,而是給你一個縮略。這個時候就要告訴它說,你要給我完整的文字內容。所以它其實跟真正的實習生一樣需要教導。但我覺得這裡面它體現的規劃能力,以及對於不能直接解決的任務去創造性解決的能力,是非常有意思的。
當然這可能不是大家使用 Devin 的典型場景,因為我沒有讓它去程式設計,而是讓它來做一個語言模型 AI 的常見事情。所以我完全可以想到,現在我們有適合程式設計的 Devin,那麼我們完全可以有適合做文字工作、適合金融界或法律界工作的對應 Agent 產品。
在這裡面我認為,只要我定義的工作是一個人坐在電腦前,透過使用電腦、上網、使用軟體能夠解決的工作,那麼它大機率都能被或多或少地在這個工作流程裡得到體現。這個還是蠻讓我覺得驚豔的。
Koji:所以你從第一天到現在,在兩週左右的時間裡,你感覺自己體驗到了一個什麼樣的未來?
雨森:在體驗 Devin 之後,我感覺它作為第一個真正能用的 Agent 產品,可能標誌著人類歷史的一個重要時刻。
為什麼這麼說呢?因為人類歷史上發明了很多工具,有人說「人就是能夠使用工具的動物。」但所有這些工具基本上都可以分為兩類:第一種是需要持續注意力的工具,比如電鑽、錘子或鍵盤滑鼠,它需要我們持續的注意力關注和輸入;第二種是機械重複的自動化工具,比如洗衣機、自動售貨機、流水線,它可以不需要我們關注,但只能解決重複的任務。
我們一直在尋找第三種——不需要持續注意力,但同時能自己規劃去解決問題的工具。這就是所謂的 Autonomous Agent。
在原來的構想裡,可能只有像 Viggle 這樣的產品在硬體上實現了。在軟體層面,我們一直沒有看到這樣的產品出現。去年有一些像 AutoGPT 這樣的嘗試,但都還停留在產品原型階段。
我發現 Cursor 定義了真正的 Agent 產品需要具備的幾個特點:
第一是由於強大的任務規劃能力帶來的非同步體驗。它原來設計的場景是在 Slack 裡你可以 @Devin 說幫我改這個 Bug,然後它自己就去改了。只有在它真的需要幫助或完成任務時才會來找我。這跟實習生很像,交代任務後他會自己工作,只在遇到解決不了的問題時才來找我。與此同時,我可以給多個實習生派活,讓我能專注做真正重要的事情。
第二是在雲端部署的虛擬機器。它可以使用瀏覽器,未來還能使用更多軟體,從而完成更多工。這和原來的 Cursor 和 Windsurf 用我自己的電腦完全不一樣。如果大家之前用過類似於 RPA 的軟體,大家會發現 RPA 在操作的時候,你是什麼都不敢操作的,因為你的操作會打斷它的流程。AI 是在用你的電腦。但 Devin 是在用虛擬機器,就像我們給實習生配電腦一樣,AI 用自己的虛擬機器帶來的靈活性非常不同。
第三,Devin 做事時像真實員工一樣會學習和成長。比如說我們招個實習生,他第一天肯定會搞砸很多事情,因為他不知道在我們這個組織里面該如何處理很多社交行為。當他做一件事情的時候,會逐漸意識到自己需要積累相關經驗,這些經驗被稱為「知識」。他會主動提示說自己學到了某個知識點,比如在找資訊時要儘量去官網查詢。我會確認他學到了這些好的知識,這個過程和我們跟實習生、員工做評估很像。就像員工寫工作總結說學到了哪幾點,我們會肯定說「對,這幾點做得很對」。這樣理論上就可以不斷積累組織內的專有知識,讓他變得更加適應這個團隊。
其實我們在招人時也是這樣。一個員工剛來的時候,他的價值相對有限,需要持續學習才能更好地適應組織。但之前在使用工具時,我們都希望這個工具一開啟就能用,不會期待說一臺電腦要不斷學習才能越來越好用。
在 Devin 這裡,我們真正看到了它具備類似人類員工的成長曲線。雖然這還比較早期,但我們發現這樣的正規化轉變非常重要。
第四,Devin 提出了根據完成任務進行收費的模式。500 美元對應 250 個 ACU,每個 ACU 約 15 分鐘工作,換算下來每小時 8 美元。這已經低於加州最低工資標準(16 美元/小時)的一半。隨著 AI 算力提高、成本下降,這筆投入在未來能做更多事情。相比招人還要處理人事、場地、管理等問題,AI 是 7×24 小時不知疲倦的員工。
有朋友說得很有意思:程式設計師喜歡 Cursor,因為它是程式設計師的 Copilot,能幫助提升效率;老闆喜歡 Devin,因為老闆考慮如何花錢買到生產力。Devin 展示了一個潛在的正規化變化,就是透過花錢去擴充套件生產力。我認為 Devin 讓我看到了工作的 Scaling Law。
在很多 Coding Agent 裡,第一個任務往往是做個人網站,我們開玩笑說「這就是新時代的 Hello World。」這個任務它完成得不錯,因為從網上找我的資訊比較容易,它能快速搭建網站。
Koji:Devin 的出現,不僅讓大家覺得 AI 程式設計變得很厲害,更是定義了一個新的互動方式。大家可以看到,AI Agent 可以如此工作。因為我和雨森在 Devin 裡面用一個團隊賬號,我能看到他所有任務的進展,能看到他怎麼用 Devin,Devin 又怎麼回應他。
這真的有一種在辦公室裡的感覺。有一個實習生一開始在幫雨森做事,現在他做了一個報告。正好雨森下樓吃飯了,我看到了他的報告,就給他建議說,其實雨森想要的是這樣,你再去完善一下,等他回來就可以看了。這種真的像是在用一個人,這也是為什麼我們說它是一個真正的 Agent。因為 Agent 翻譯過來是「人」,而不僅僅是機器,它是某種助理的意思。這是為什麼我感覺 Devin 產生了一個新的、像用助理一樣的正規化。
雨森:對,這裡面還有很多細節挺有意思的。我再舉一個例子,在我們另外一個朋友的任務裡,他要 Devin 去 LinkedIn 上抓一些人的資訊。比如說 OpenAI 的中國員工,但 Devin 顯然沒有 LinkedIn 賬號,所以它需要找使用者說,你能不能幫我登入一下 LinkedIn 賬號。這時候,因為 Devin 執行在虛擬機器上,所以它有個互動模式。作為使用者,我可以在虛擬機器裡輸入我的 LinkedIn 賬號和密碼,然後 Devin 就繼續使用。
這很像什麼呢?比如我們招一個實習生,給他配了臺電腦,但他沒有特定軟體的訂閱賬號,他就會說「老闆你來輸一下你的賬號」,在我把賬號輸進去之後,他就繼續用我登入好的賬號工作。
這就是為什麼虛擬機器變得很重要,因為它可以在裡面做很多操作,不打斷我的工作流程。否則就像 Cursor 或 Windsurf 那樣借用我的電腦,那時我什麼也幹不了。這種非同步的方式讓我可以同時給 Devin 佈置很多工,它是個並行的工作模式,我只需要付出算力成本就行了。
這其實很重要。比如在日常生活中我有一個實習生,但如果我有十個實習生,每個人都能幫我做很多事情。這個工作效率的提升可能是指數級的。
Koji:就讓我想起了當年說「人人都是產品經理」,但今天就變成了「人人都是 CEO」。因為在和 AI 單位互動的過程當中,好像只需要做 CEO 最喜歡做的三件事:第一,下指令;第二,檢查工作;第三,高水平一點的 CEO 還可以給它一些啟發和指點。
雨森:其實很多人在使用 Devin 或其他 AI 產品時,都會遇到一個問題:我要做什麼,以及我該如何提出需求。想象一下,如果我們招一個員工,只對他說「幫我寫個淘寶」,那這個人肯定是做不出來的。但為什麼我們對 AI 常常會有一些不切實際的想法,認為說「你給我做個淘寶」它就能做出來?這顯然是不對的。
確實,我們每個人都要思考自己到底要做什麼。很多人面對一個很強大的模型時,雖然它具備很多能力,但關鍵在於你是否明確自己想做的事情,以及能否用更加合理、容易理解、更有結構的方式提出需求。
就像我們自己在做產品經理、設計師、程式設計師的時候,也很煩那種自己都沒搞懂需求的老闆,比如提出「五彩斑斕的黑」這樣的需求。但當我們自己成為 AI 的老闆時,我們能不能做一個好的老闆?這其實是接下來每個人都要學會的過程:如何當一個好老闆。
Koji:其實在使用過程中還有一個很強的感受,這也是 hidecloud 前段時間提到的。他提醒大家,Devin 有一個非常厲害之處,在於它可以幫助我們呼叫人類歷史上的智慧結晶。這句話怎麼理解呢?
就是說我們要完成一個任務時,往往不知道世界上已經存在這樣的輪子,不知道誰已經開發了這樣的工具。因為很多工具是以程式碼的形式,以程式碼庫的形式放在 GitHub 或者 Hugging Face 上。要把這樣的程式碼下載到本地,部署到機器上,並且和其他工作或軟體程式聯通執行,這件事一千個人裡可能只有一個人能做到。但今天有了 Devin 之後,理論上人人都可以做到,因為你可以用自然語言像老闆一樣下指令。
舉一個具體的例子:比如說現在我們要做一個國際象棋應用。在過去,僅僅是把國際象棋的規則寫出來,就需要花幾百行甚至上千行程式碼。你可能會想說,我去搜索一下,看看是不是已經有人把這個規則寫成了可呼叫的程式碼庫。但你可能會搜出 Google 幾百頁的結果,在這裡面什麼是最好的、什麼是最佳實踐也不知道。但有了 Devin 之後,你可以把這個命令下給它,它會用自己的分析方式幫你找到已經存在的最適合的程式程式碼庫,然後直接用起來。
這帶來的價值是:所有前人開發過的、用於解決特定問題的工具或程式碼庫,你都可以直接使用,不必重新造輪子。你可以站在巨人的肩膀上,用這些經過社群驗證的最佳實踐來開發自己想要的工具。我覺得這也是 Devin 包括 Cursor 實現的一個價值,雖然可能不那麼顯著,但影響很深遠。
雨森:當 ChatGPT 剛出現時,我就有一個很強烈的感覺:如果你的工作中有很多是複製貼上或者「縫合怪」的部分,那這個是很容易被替代的。大家發現最早被 AI 大幅提效(說得好聽點是提效,說得不好聽是容易被替代)的工作,其實就是初級美工的這種剪貼型設計工作。比如把別人的設計抄過來,或者初級程式碼工作者把某個庫簡單修改後應用到自己專案裡。這樣的工作最容易被替代,所以前端程式設計師其實面臨很大的壓力,因為前端展示大部分時候並不需要那麼多創新的想法。
在這個過程中,我覺得對於大家來說,如何提出想法、如何創造性地解決問題,這些能力會變得越來越重要。
而找到已有的解決方案,把它們用膠水粘起來的工作,恰恰是 AI 最擅長的。我們工作中的大部分內容其實都是已經被解決過的問題,或者已經被髮明的輪子,只是以前人類不知道這些輪子的存在,或者沒有辦法把它們很好地拼接起來。但現在 AI 能夠幫我們做到這一點,讓我們能夠專注于思考「要做什麼」這件事情,這會變得越來越重要。
這也讓我想到對於教育的影響。我們之前大量的教育,包括培訓都在教「怎麼做執行工作」。就好像當沒有計算器的時候,我們要學大量的手算和心算。但現在,我們需要了解計算的原理,但未必要去做這些具體的計算。我們可以把更多的精力花在思考要做什麼、提出正確的問題上。這也是我覺得未來教育體系需要做出重大變革的原因。
Koji:所以 2025 年是非常值得期待的。從 Devin 的釋出,我們看到的不只是 AI 程式設計被 Agent 整個升級到下一個級別,這樣新正規化的出現會給方方面面帶來顛覆式的革命,也意味著各種創業的機會。
剛才雨森提到了一個非常有趣的觀點:Devin 是人類歷史上第一個既不需要持續注意力,又不只是機械重複的工具。這也讓我們看到了工作的某種 Scaling Law。您覺得可以再展開講解一下嗎?讓大家更好地理解這意味著怎樣的了不起的價值。
雨森:首先說說 Scaling Law,最直白的解釋就是我能夠透過投入更多的錢來獲得更多的生產力,這裡的錢可以等價於算力。這其實很不容易,想想看,很多公司融了很多錢,但似乎並不能把錢有效地轉化為生產力——他們需要招人、搭建組織、做各種瑣事。但隨著這種可以非同步工作的 AI Agent 的出現,我們可以把很多工分配給不同型別的 AI 去做。它們消耗的是算力和電力,就能完成任務本身,而且可以並行進行。
你完全可以想象,會有一個更擅長提出需求、拆解需求的「產品經理型」AI 去指揮很多 AI 程式設計師工作,形成一個虛擬組織。在這個組織里,你更需要考慮兩件事:第一,你要做什麼;第二,要有足夠的算力和資金投入。在這樣一個正在快速成為現實的組織里,我們可以透過投入更多的錢和算力,有效地把工作規模化擴充套件。這就是所謂的工作的 Scaling Law。
第二點很有趣。我們經常遇到創業者說「我有個很好的想法,但缺個程式設計師」。
優秀的程式設計執行能力現在還是稀缺資源。但當執行本身不再稀缺,「做什麼」就變得尤為重要。就像剛才說的,每個人都要學會當老闆。這樣我們能看到更多的創業機會,很多原本因為缺乏優秀程式設計師而被埋沒的創業者,現在可能會獲得更多機會,更多創意可能被付諸實踐。這也是我們可以把創業這件事情規模化的一個原因:因為透過投入資金就能提高生產力。
這一切得以實現是因為 AI Agent 能夠並行工作。如果我們的注意力要放在工具上,那注意力是有限的。但現在我們的注意力可以分配到不同的 Agent 上,一個人可以同時給多個 Agent 下達指令去完成任務。
Koji:其實說到 Scaling Law,我想到一個比喻。當年王興讓我們看一本書叫「領導梯隊」,書中講到當你第一次成為小團隊的領導時,你要有一個重要的認知轉變:你的產出不再是你個人的產出,而是整個團隊的產出。
在今天,我們從 Devin 身上看到的工作的 Scaling Law 其實也是類似的。這裡的產出不再是你一個人專注在眼前工作的產出,而是取決於你如何把團隊任務下達好,把檢查標準設定好。團隊的所有產出,包括 Devin 的所有產出,最終都會成為你的產出。這意味著你可以用有限的注意力實現無限的 Scale-up。只要你能夠管理足夠多的人和 Agent,而且管理 AI Agent 比管理人要容易得多,因為管理人涉及更多的溝通協調和情緒價值。我理解這可能就是雨森想說的工作的 Scaling Law。
雨森:這個概念沒有問題:設想如果你能成為一家跨國公司的 CEO,能夠指揮上千人、上萬人,你能做什麼事情?以前我們沒有這樣的機會,但現在可以透過管理 AI Agent、讓 Agent 去調動其他 Agent 來獲得類似的機會。這所需要的就是錢和算力,而很多公司其實並不缺錢,他們缺的是人才,是能把事情執行出來的組織結構。
所以我相信在這種情況下會出現兩種趨勢:一方面,有實力的公司和個人能做更多的事情;另一方面,很多有想法的人可以透過相對較少的成本,快速把想法實現出來,獲得使用者認可或投資,這樣我們就會有更多創業者和創新空間。
Koji:對,這就是今年最流行的說法之一:「超級個體」。因為一個人在獲得越來越多工具的賦能之後,包括 AI Agent 的賦能,就可以做到原來需要十個人、二十個人才能完成的事情。
不過 Devin 釋出後不久,也收到了很多吐槽和批評。對此你會怎麼看?
雨森:很多批評都集中在 500 美金的價格上,大家把它和 Cursor 20 美金的價格進行對比。首先,我認為這是兩種不同的正規化。
一種是需要用我的時間去使用的工具,它讓我的時間變得更高效,但並沒有省下時間。所以在使用 Cursor 這種工具型產品時,因為我的成本並沒有下降,實際上是我的成本加上工具的成本。但如果把它當作一個員工,對比物件就變成了員工的工資。只要它能夠比同等價格招到的員工幹更多的活,我認為這個價格在歐美市場是可以接受的。很多人一看到價格就說這是不是在割韭菜,其實關鍵是看你怎麼看待和使用它。
我和一些程式設計師討論他們使用 Cursor 和 Devin 的體驗,發現在 Devin 能力還不夠強的時候,使用 Devin 對於大多數程式設計師的工作流是一個很大的轉變。因為程式設計師自己懂得程式碼如何執行,他們往往希望自己能夠掌控全域性,所以這個時候 Cursor 這樣的 Copilot 是一個更適合他們當前工作流程的方案。已經習慣了使用 IDE 工作的程式設計師,在有任務要完成時,需要和 Devin 對話、等待 Devin 工作然後驗收,這個過程並不那麼高效。他們更希望自己去修 Bug 或者寫程式碼,如果你是一個很厲害的程式設計師,你可能不會願意必須帶一個能力有限的實習生。因為現在的 Devin 還只是個實習生水平,培養實習生需要時間和耐心。
這個時候程式設計師可能會覺得,與其等你寫程式碼,還要幫你解決問題,不如自己寫。我覺得在技術早期階段這是完全可以理解的,我們要從人的角度去看待這個問題。如果一個人犯錯誤,作為管理者我們往往會比較有耐心,因為我們知道人是會學習和成長的。今天指出他的問題,他可能就會記住,然後會有更多的動力去工作,透過培訓成為不錯的程式設計師。
Devin 其實是可以學習的。但我們現在對於 AI 的軟體和產品還沒有建立起「它可以成長、可以學習、可以被管理」的預期。
所以當它出現問題時,很多使用者的反應就變成了「我買了一個 500 美金這麼貴的工具,居然也會出問題」,感到失望。因此在企業引入 Devin 這樣的產品時,對其期望值的管理變得很重要。包括 Devin 自己在文件中也說明,它首先是做一些會安排給實習生做的事情,比如簡單的前端任務、修改 Bug、給前端加一個 Dark Mode 的開關之類的工作。
但是人類提出好問題的能力也是需要學習的。我經常看到有人提出「幫我寫個淘寶」「幫我做個微信」這樣的需求,這遠超出它的能力範圍。現在的 Devin 和所有 AI 產品一樣,會傻傻地接下這個任務說「好,我來幫你寫個淘寶」。這種情況下得到的結果肯定不會令人滿意。如何用好一個工具是需要學習的,現在還沒有到給什麼需求都能直接完成的程度,那樣就不是實習生而是神了。
隨著 Devin 能力的提升,以及對組織環境理解的加深,我相信它會從實習生逐漸成長為初級全職員工,然後變成資深全職員工,這需要一個接受的過程。
我覺得 Cursor 是在現有流程上的漸進式創新,它沒有讓程式設計師的工作發生翻天覆地的改變。但 Devin 是一個顛覆式創新的邏輯,這往往需要很多適應時間和不同的入職培訓過程。第一個產品可能未必能做到這一點,所以我並不覺得 Devin 就一定是最終答案。
很可能 Devin 只是展示了未來 AI 產品的一種形態。我們要真正學會適應、使用 AI 型的產品,就像適應 SaaS 這個概念、適應遠端辦公這樣的分散式工作概念一樣,都需要很長的時間和合適的契機。所以我覺得它在方向上給了我們很大的指示,但現在還是實習生水平。在這個過程中指出它的問題很容易,但更重要的是它提出了這樣一個未來的方向,從這裡得到啟發去做更好的 Agent 才是關鍵。
Koji:這就像半杯水的理論,有人從半杯水裡看到的是價值,有人看到的是問題。就像我們剛才討論 Devin 完成「尋找十個頂級 VC 的 Manifesto」這個任務時,它知道如何在 Accel 官網沒有相關背景的情況下,從新聞稿中找到這些內容。這是一個巨大的亮點,它會設定任務、會反思、會自檢查。另一方面確實也存在很多問題,比如它做出來的網頁非常不美觀。但看到亮點而不是問題,看到未來的可能性而不是當下值得批評的點,這讓我想到:批評者往往感到正確,但只有建造者雖然看上去笨拙,卻更有可能會成功。
這讓我想到王慧文說過的一句話:如果你相信一件事情終究會發生,那就每隔三年做一次。Agent 從人類有科幻開始就一直被認為會出現,也時不時會有人去嘗試。而在看到 Devin 之後,感覺這可能是我們最接近成功的一次。
我們再來聊聊 2025 年。整個 2024 年,雖然我們的討論也挺樂觀,但整個大環境時不時會出現各種悲觀的論調。我尤其記得在第二、三季度的時候,整個語境都在討論 AI 的 PMF 究竟在哪裡,看上去這一波 AI 落地比預期要難。
現在站在 2025 年的開端,有一個非常簡單的 Yes or No 的問題:雨森你對 2025 年是樂觀的嗎?
雨森:我其實還是很樂觀的。
第一,AI 應用找 PMF 這件事本身就不應該期待它那麼快。我經常打個比方,雖然很多人把 ChatGPT 的釋出與 iPhone 釋出做對比,說 AI 來到了 iPhone 時代,但我始終認為它代表的是一個黑莓時代。
黑莓時代和 iPhone 時代有什麼區別?黑莓時代可能很多聽眾還沒有用過黑莓,這屬於我們 80 後的記憶。在 iPhone 釋出之前,智慧手機的形態很不統一,因為那時技術還比較早期,發展也比較分散,大家沒有找到一個收斂的路徑。這導致很多事情想做但做不到,技術本身也很貴,沒有統一的開發標準和產品標準,開發者也比較少。所以在那個時候,想做移動網際網路上真正火的應用,比如抖音是很難做出來的。我反覆提到過這個觀點:在黑莓時代做不了抖音。隨著技術進步,從黑莓時代到 iPhone 時代會解鎖更多的應用機會。
iPhone 出現之後,首先技術發展足夠好了,很多應用從「想做」變成「能做」,包括它有好的攝像頭、好的螢幕、好的處理器。其次技術變得標準化,iPhone 釋出之後,手機都長了一個樣子,大家發現技術方向收斂了。同時也誕生了更多的開發者,因為開發變得容易,技術也標準化和便宜了,大家更理解了,所以 iPhone 時代誕生了大量的應用。
在 ChatGPT 剛出來時,我們也發現很多事情想得到做不到。比如 Agent 就是個典型的例子,2023 年上半年有個嘗試叫 AutoGPT,它提出了很多很好的概念,也是用語言模型先做計劃,然後去檢查完成情況並迭代。但那時的模型太多幻覺,很難有效使用工具,也很難有效瀏覽網路,所以根本做不到。這是個典型的「在黑莓時代做抖音做不出來」的例子。
現在隨著 Agent 在推理能力、程式設計能力、工具使用能力上的進步,Agent 的樣子就更加有模有樣了。雖然還有很多缺點,但至少已經達到實習生水平可用的第一步。這是技術進步解鎖更多應用機會的典型例子,我相信這是一個最終會把我們從黑莓時代帶到 iPhone 時代的例子。
從 ChatGPT 出現到現在這兩年,我們看到了巨大的進步,這讓我很樂觀。僅僅兩年時間,AI 程式設計就從 ChatGPT 的「你問我答」變成了 Devin 的「你問我做」和 Cursor 的「你問我寫」,帶來了非常大的進步,這個速度其實很快。
第二,很多時候 PMF 是來自於技術本身的進步。比如 Cursor 這個產品其實在 2023 年就出現了,但當時它提出的預測下一個行動,需要更強大的模型去進行預測並寫出更好的程式碼。可以說是 Sonnet 3.5 的出現造就了 Cursor 真正能夠完成它要做的事情。Sonnet 3.5 激活了 Cursor 想要交付的產品體驗,同時 Cursor 的普及也讓 Sonnet 3.5 迅速成為 AI 程式設計領域最受歡迎的模型,這是個互相成就的關係。
同樣,Devin 這樣的產品要成功,也需要模型在推理、工具使用這些能力上的提高。Sonnet 3.5 或者 GPT 4o 現在可能還不足以把它做好。所以 Devin 這個產品形態可能需要一個更先進的模型去啟用它,這個模型可能是 o1、o3 或者是 Anthropic 的其他新模型。這是一個產品等待模型啟用,然後讓模型得到廣泛使用的互惠過程,所以這個階段確實需要技術和模型本身的進步。
我們剛剛經歷的移動網際網路成熟期有個特點是產品非常容易使用。比如抖音動動手指就可以了,微信、小紅書都很容易上手。但當我們來到一個技術的早期,要用好一個產品是有門檻的。大家可以想想最早的智慧手機、個人電腦、網際網路,其實都需要學習才能使用。
現在很多人使用 AI 時遠遠沒有把產品裡的智慧提取出來。現在的大模型,不管是 OpenAI、Claude 還是 Kimi,其實模型裡都已經壓縮了大量的知識和智慧。但我們有沒有學會正確地使用它,高效地提問,高效地提取模型裡的智慧。
我認為大部分人還沒有學會,包括我自己。我一直都在發現原來模型能夠為我做這樣的事情,回答這樣的問題。所以在這個過程中,我們經歷了從易用產品的移動網際網路時代到需要學習使用的深度 AI 時代。
這個時候大家一開始體驗會有點挫敗感,覺得產品有點難用,這就是技術早期的特點。很多時候應用已經可以做很多事情了,只是我們還不太會用,還沒有變成一個好的提問者或者好的管理者。
這些都需要學習,或者說需要等模型能力越來越強時幫我們做這些事情。到那時可能我們又會進入到一個產品應用期,但現在產品還處在和我們磨合的階段。
Koji:所以大家要在嘗試的過程中瞭解邊界在哪裡,以及邊界現在如何不斷拓展。我想補充一下,除了剛才提到的技術和模型的新進步所解鎖的新機會,尤其在 Agent 這個領域,還有第四個方面。
在上一期「十字路口」,我們討論 OpenAI 12 天釋出會時,嘉賓大聰明提到,這次釋出會其實有一些重磅內容沒有公佈,是出於 PR 考慮或是不想讓競爭對手過度關注。其中有一個對 Agent 至關重要的點,就是現在 OpenAI 輸出的 Function Call 以及結構化輸出的能力,能夠讓 Agent 得到更加精確的指令。這一點之前可能被忽略了,但說出來後非常合理。
再看 2025 年,雨森你認為什麼樣的應用方向比較容易落地?這也是現在創業者非常關注的方向。
雨森:從過去兩年比較容易落地的方向來看,我覺得有幾個。
第一個是能幫客戶賺錢的。如果你的技術還不夠完善,但能直接幫我賺錢,或在商業化流程中直接提高效率就變得很重要。比如說像 Midjourney,它有幾億美金的年化收入,其中約一半收入來自廣告類需求,就是用它去生成商業用途的影像來投放廣告。這是一個很實在的場景,我本來做這些廣告就是為了賺錢,現在能夠更快更好地製作廣告內容。比如 HeyGen 主要也被用於營銷場景,大家用它來製作宣傳型的影片廣告內容。所以首先,能幫客戶賺到錢的技術,在早期階段大家就願意花時間去使用、去琢磨。
第二個是能夠在重要任務上提高十倍以上生產力的。因為一個好的技術,如果只提高 50% 的生產力,那其實大家可能還會有很多阻力。一定是這個東西能帶來非常強的生產力提升,比如說像 Cursor、Devin 這種對程式設計師來說絕對是十倍生產力的提高。程式設計師花時間去找程式碼庫可能就得花很長時間,所以大家使用它的動力才會變得非常強。
再比如 Perplexity 這樣的 AI 搜尋引擎,對於傳統搜尋引擎來說,它也是個十倍生產力的提升。因為原來我要找 Koji 資料,得去搜索很多內容,要看十幾二十篇 「新世相」的文章。現在我只要去問它,它會幫我去看這幾十篇網頁然後進行總結。所以在資訊收集提問類的問題上,比搜尋引擎要高出十倍以上的效率。這種產品比較容易找到產品市場契合度。
第三點就是滿足人性基本需求,比如說 NSFW 內容,大家也都看到了很多這樣的場景。整體來說,要麼能賺錢,要麼能幫我提高非常高的效率,這兩個能實現一個就非常好。
Koji:那有什麼樣的應用方向是你覺得大家要稍微迴避一下,做起來有點難度的?
雨森:在移動互聯網裡,很多贏家都是「殺時間」的應用。在中國,大家習慣了做一個使用者粘性很高的應用,使用者在上面花很多時間,然後透過投放廣告賺錢。位元組、小紅書、快手都是這個正規化。這是移動網際網路已有的正規化,因為它是一個新裝置,讓使用者原來無法上網的時間變得可用,是一個從零到一的邏輯。
現在當抖音這樣的應用已經佔用我們大量時間的時候,如果 AI 應用一開始就要和這些成熟玩家比拼「殺時間」,就會遇到競爭對手已經非常強大,並且已經佔據大部分時間的情況。這時再做「殺時間」的應用是很難的。
最後能落地的只有相對小眾、面向特定人群的產品。而針對普通使用者的 AI 陪伴聊天很難比抖音這樣的影片更有吸引力。與巨頭搶時間的應用要謹慎。
第二,改變物理世界還是比較難的事情。我們剛才說到 AI 寫程式碼、AI 使用工具都還是在數字世界裡。在數字世界裡 AI 可以做很多事情,但在物理世界,AI 現在連拿起一個杯子這樣基礎的動作操作還是比較難的。
雖然我們現在看到人形機器人非常火爆,但在這個方向上,技術的實現路徑以及如何擴充套件模型的資料,還都是開放性問題。在未來三五年內,要改變物理世界的應用還會遇到很多挑戰。
第三,這兩年有不少裝置想要替代手機,比如 Rabbit、Humane 這些。他們強調要做一個替代手機的產品,包括現在大約有 100 個團隊在做智慧眼鏡。我的看法是,如果你做的場景是手機已有場景中的一個,比如打電話、搜尋周邊資訊、聽音樂等,那替代手機是非常難的事情。
目前來看,能與手機共存的硬體,基本都是在做手機完全做不到的事情。比如無人機可以飛,智慧手錶可以戴在手腕上,智慧戒指可以套在手上,或者像 Insta360 可以在運動場景下使用。但像 Humane、Rabbit 這些產品,其實都是在做手機已經做得很好的場景。這時使用者的切換動力非常小,因為手機在大多數場景下已經至少能做到 80% 的程度。除非你做的這個產品好很多很多,或者是手機根本不能做的事情,否則要替代手機會很難。
我覺得 2025 年我們可以看到特別多的 Agent 產品出現。這裡面很多會遇到一個挑戰:當你要對組織做出很大改變時,能否實現這樣的改變。比如 Devin 就面臨著要改變程式設計師的工作方式,從自己寫程式碼變成指揮別人寫程式碼。這種工作流的改變對很多組織來說都有很多阻力,尤其是在大公司裡。
我們發現,在大公司推行 AI 還牽扯到很多資料許可權、隱私安全等問題。如果要改變工作流,很多人的工作都會發生變化,那就會有更大的難度。所以我覺得要對組織做出很大改變,除非你能顯著提高生產力,讓組織有不得不用的理由,或者針對中小型企業去做。否則針對大組織做大改變,很多時候面臨的是人性的壁壘,而不是技術的壁壘。
07
2025 展望:Agent、個性化服務與超人類水平的突破
Koji:我們剛才聊到,技術的解鎖帶來了一些新的機會,討論較多的是模型的推理能力、幻覺降低、計算機使用能力所帶來的 Agent 機會。除此之外,還有哪些技術的解鎖你認為在 2025 年可能帶來浪潮式的 AI 創業機會?
雨森:我自己總結了幾個 2025 年可能帶來浪潮式 AI 創業機會的技術解鎖方向:
第一是 Agent。我們剛才討論過,未來會出現針對各個領域的 AI 產品。它們會借鑑 Devin 的思路,做非同步的工具使用,按工作量收費。
在美國,有人把原來的 SaaS(Software as a Service)反過來叫「Service as Software」,即把服務變成軟體銷售,或者說是 sell work, not software,銷售的是工作結果而非工具本身。
2025 年可能會有很多這樣的嘗試,雖然很多會失敗,但也會有一些有意思的產品誕生。
第二是「Scalable Personalization(可擴充套件的個性化)」。回顧網際網路內容分發的發展歷程:先是入口網站的「千人一面」,每個人看到的都一樣;然後是搜尋引擎,針對關鍵詞提供個性化內容,但同樣的關鍵詞得到相同結果;再到以抖音為代表的推薦演算法,根據使用者背景資訊主動推送感興趣的內容。
現在,我們在思考更進一步的個性化:如果使用者想看的內容還不存在,就為他生成。比如 Sora 這樣的影片生成技術,就是要按照個性化需求生成內容。最近增長很快的應用 bolt.new 和 Windsurf,都是透過文字 Prompt 生成個性化網站。在軟體開發領域,未來可能不再是像微信、抖音這樣的「好萊塢大片式」集中化開發,而是為每類使用者提供更個性化的軟體 / 內容體驗。
Google 的 NotebookLM 也體現了這種趨勢。比如播客內容,現在我們只能聽到已經錄製的對話,但未來可能透過 AI 生成任意兩個人關於特定話題的對話。隨著 AI 能力提升,我們使用的軟體、消費的內容都將變得更加個性化。
第三是 在 o3 中我們能看到 AI 能力從「普通人水平」進化到「超人水平」。早期的 MMLU 等測試還在評估 AI 是否達到普通人水平,現在已經轉向針對精英人類的 Benchmark,如面向程式設計師的 SWE-bench、美國高中數學競賽 AIME、PhD 資格考試 GPQA 等。在 2024 年初,o1、o3 等先進模型在這些測試中已經達到了 80 分左右的水平。
我們現在需要建立超人類水平的 Benchmark,比如陶哲軒背書的 FrontierMath。o3 最近在 Codeforces 上獲得 2700 分,這是全人類僅有 130 多人達到過的水平。這意味著 AI 在科學研究、前沿探索方面將發揮重要作用。
我看到 o3 出來之後,有人詬病說它做一個任務需要花很多錢,算力消耗很大。但 o3 的高算力模式本來就不是給普通任務用的,它的定位是解決人類前沿最難的研究和探索問題。這個東西貴是很正常的事情。
其實我們以後會發現 AI 模型在日常任務和前沿研究上可能會有分叉。就像「生活大爆炸」裡面的 Sheldon,他是個很厲害的科學家,但日常任務一塌糊塗。有的 AI 模型就更像 Sheldon,去解決前沿探索的問題;有的就像價廉物美的 o3 mini,主要用來幹活的,可能就像一個程式設計師;還有更加簡單的模型,就是為了回答一些端側的簡單問題,比如說今天天氣怎麼樣這樣的日常需求。
在這裡,我們既可以看到日常需求被越來越高效便宜地解決,也能看到在真正的前沿研究裡,AI 跟科學家一起協作,為人類獲得新的進展,從而產生新的知識。這一點讓我覺得非常興奮。
Koji:今年在多模態方面還有一個較大的突破。除 4o 即時語音外,還有一點被 OpenAI 釋出放在一個不太起眼的角落,但卻被認為是 12 天來最值得關注的成果之一,即他們的多端到多端的多模態互動。你認為多模態在明年會帶來哪些值得期待的創業機會?
雨森:第一重要的是 AI 怎麼理解這個多模態的世界。
對於文字來說,比如「今天天氣很好」這幾個字,是一個非常簡單的句子,但它裡面蘊含了大量需要看到才能理解的東西,所以一圖勝千言。
圖片和影像中包含的資訊特別多。如果 AI 不能充分理解這些資訊,它的智慧就會有很大的缺陷。現在的 AI 就像一個瞎子,雖然瞎子也可以解很厲害的數學題,這可能並不妨礙什麼,但要具備更完整的智慧,多模態的理解能力確實很重要。
OpenAI 和海外的先進研究者普遍認為生成能力可能不是最重要的,所以 Sora 現在獲得的資源相對比較少。在美國,多模態的生成是個相對平行的路線,因為它的落地場景主要是娛樂內容和內容生產,所以跟 AGI 似乎還是有些距離。像 Anthropic 這樣的公司因為不做多模態生成,他們認為靠文字、程式碼和 API 就能實現 AGI,這是不同的觀點。
關於多模態這個話題,我覺得 NotebookLM 給我們一個很好的啟示:如何把一個模態的內容轉換到另一個模態進行消費。
比如說我們原來做 TTS,是把文字直接轉成語音,但把文字轉成播客,不是簡單地把它讀出來就完了,那隻能叫讀書。播客需要把內容變成更適合在音訊模態消費的形式。同樣,從文字到影片也是如此,我們把《三國演義》拍成電視劇,不是簡單地還原,而是需要藝術改編。影片到文字、影片到聲音也是這樣。在不同模態之間自然轉換,並在每個模態中創造最適合該模態消費的內容,這是一個很令人激動的過程。
假設我喜歡刷抖音,那我能把《三體》變成適合抖音消費的內容,或者變成適合播客消費的內容,這在內容消費上會帶來很多機會。
更進一步說,大家認為多模態的生成和理解對具身智慧會有很大幫助。我們看到很多前沿研究,比如最近的 Genesis 專案,研究如何實現對物理世界的模擬,以及機器人如何操作現實生活中的物體,這些都是很有意思的研究。不過這個領域我最近研究得相對較少。
總的來說,多模態之間的轉換確實是一個非常重要的方向。就像你提到的 Gemini 2.0,它能夠高效理解接收到的影片訊號。這帶來一些很直觀的應用場景,比如在生活中,有很多東西我們看到卻不會用,但如果它的影片生成能力夠強,就可以直接在影片畫面上疊加使用指示。比如我們之前跟 Google 的研究員討論過這樣一個場景:我家有個咖啡機,把手機對著它,影片流裡就會直接疊加一個「按這個按鈕開始煮咖啡」的影片提示。這個提示影片是生成的,但會疊加在現有影片上。這些都是很有意思的想法,但目前可能還需要技術進一步提升。
08
AI Native 應用:等待深度技術擴散後的新商業模式
Koji:我覺得 2025 年很可能會看到這樣的應用出現,包括它和 AI 硬體的結合。比如之前看到一個 demo 是帶著 AI 眼鏡打網球,它可以給你即時指導,告訴你對面球過來時如何調整姿態和接球方式,幫助你更好地提升水平。
關於多端到多端,我想再多說一點,這是我最近感到非常驚喜的發展。就像上一期「十字路口」節目中嘉賓提到的,在 12 天釋出會上,這項技術雖然釋出了,但被放在一個不起眼的角落。他認為這其實是最值得關注的突破。OpenAI 為了避免被競爭對手關注,選擇低調地透露這一資訊。不過在開發者群體中,他們還是在一些重點開發者那裡進行了一對一的推廣。
這項技術的特別之處在於可以同時接收多模態輸入,並同時輸出多模態內容。而且這種輸入和輸出是多端到多端的。大家知道端到端的概念,那麼多端到多端其實是端到端在級別上的幾個層次躍升。
另外還想問問雨森一個很有意思的問題,這應該是所有人都關注的:你認為 AI Native 應用的大機會可能會是什麼樣子?
雨森:首先我覺得大機會的出現,應該是在深度 AI 技術擴散之後。如果現在使用的還是小眾人群,那大機會可能還沒有顯現。讓我們覆盤一下歷史上網際網路原生應用和移動網際網路原生應用的出現過程。
第一步是隨著技術擴散,用新技術解決老問題。比如網際網路時代,我們有電子郵件解決通訊問題,有入口網站解決看新聞的問題,有自營電商解決賣貨的問題。但隨著網際網路進一步擴張,當人們都上網後才出現了社交網路;資訊都上網後,才出現了搜尋引擎的必要性;當買家、賣家、支付和物流都建設完善後,才出現了平臺電商。這些平臺電商、社交網路、搜尋引擎才是真正的網際網路原生應用,而且都是創業公司做的,最終佔據了最大的市值。
移動網際網路原生應用也是類似,當移動網際網路(包括智慧手機硬體和 4G 網路)普及後,內容生產者和消費者都用上了智慧手機,才會出現抖音、快手、小紅書這樣的移動網際網路資訊平臺。當藍領工作者都用上智慧手機後,才能誕生美團外賣、滴滴這樣的應用;當遊戲玩家都用上手機後,才能出現米哈遊和王者榮耀這樣的移動網際網路原生遊戲。
AI Native 應用的出現應該也會遵循類似邏輯。首先可能是像 ChatGPT 這樣的應用,讓每個人都有了 AI 助手,但它的擴散規模還需要更大。當我們每個人都有了自己的 AI 助手,用 AI 解決工作中的很多問題,甚至像現在這樣開會,就會產生新的可能。
這時 AI 與 AI 之間的互動會產生什麼樣的結果?比如在一個公司裡,如果大部分工作執行都由 AI 來完成,那麼對生產力、對企業服務軟體可能產生巨大變化。因為你不僅要執行,還要管理這些 AI,為它們下達任務、進行任務拆解。這些可能是人類完全做不到的,因為人沒有那麼多注意力和精力。
另外一個重要主題是 AI 時代的商業化方式。在移動網際網路和網際網路時代,大量商業化都是透過廣告進行的。但當你用 Kimi 或 Perplexity 問問題時,原來搜尋引擎裡的廣告、網頁上的廣告都不會被看到,因為是 AI 幫你看了這些網頁。這就需要重構價值獲取方式。我從 AI 那裡得到答案的價值該如何提取?原來廣告是給人看的,但 AI 看到廣告就會把它們過濾掉。所以對廣告商業模式的顛覆,也會帶來很多 AI Native 應用的機會。
Koji:我們最後一個問題,就是在 2025 年,真格基金和你最感興趣的投資方向會有哪些?尤其是這裡面有沒有一些是行業的非共識,是你們差異化的觀點?
雨森:我們的差異化觀點主要有三個方面:
第一,我們對「殺時間」類應用會比較謹慎。現在很多人都在按照字節跳動的經驗去找下一個字節跳動,尋找一個耗時高、靠投放起量的 To C 應用。但我覺得當使用者時長已經被位元組佔用這麼多的情況下,下一個殺手級應用未必會以這種正規化出現。也就是說,下一個字節跳動可能不會長得像字節跳動。
第二,相比當下對人形機器人的熱情,我們保持相對冷靜。我們看到很多人形機器人本體公司獲得了大量融資,但通用型人形機器人的技術路徑,無論是 Sim-to-Real、從影片角度訓練,還是操作資料收集,技術都還沒有收斂。如何大規模收集這類資料也還是個開放性問題。這個領域的投資情緒比較過熱。人形機器人要在物理世界完成任務,甚至進入家庭做家務,所需時間可能比當前預計和投資週期要長得多。因此對於本體我們比較謹慎,但我們投資了靈巧手、電機等人形機器人領域重要的上游零部件。
第三,關於AI 在生產力領域的應用。我們發現在美國,Agent 在生產力和企業服務領域的落地很快。但在中國,因為普遍認為企業不會為工具付費,所以遇到了很多阻力和挑戰,很多企業服務的創業者和投資人都受到了傷害。但我在想,當一個情緒非常極端時,往往也意味著反轉的機會。
如果單純賣工具在中國可能很難成立,但如果是以十倍低的價格提供工作結果本身,未必是企業不願意購買的。這可能會成為一種強大的 AI 外包模式,不是傳統的人力資源外包,而是把任務外包給 AI Agent 去完成。
我們在思考,如果一定要在 AI 領域尋找 To C 的娛樂應用場景,這始終是比較難的。但能否將生產力的巨大突破和中國的產品落地結合起來?我覺得企業服務也許不是鐵板一塊,也許在這裡存在新的機會。
Koji:那你們重點關注的方向有哪些?剛才講的是一些非共識觀點,或者說你們認為需要警惕和深入思考的方向。那麼你們重點看的方向有哪些?
雨森:因為我們始終是一個以創業者為核心的基金,所以不會每年都預先定義重點關注方向。但說說我個人的看法,今年各種形式讓 AI 去做 Agent 在做的事情,我覺得會是一個非常重要的領域。同時,我覺得剛才提到的透過 AI 的程式設計或模態轉換來實現規模化的個性化能力也很重要。
我們投資的一家 AI 教育公司就是在探索如何透過 AI 讓教育變得足夠個性化。原來的網際網路教育是解決教育的規模化問題,用網際網路方式把名師教育下放給更多人。但更進一步,我們希望在保持規模的同時實現個性化,這是 AI 帶給我們的一個重要機會。
所以我們剛才說了「與愛為舞」這家 AIGC 技術公司,同時也投資了一些想做類似 bolt.new 這種由 AI 程式設計來生成個性化應用方向的公司。但這個領域還處在非常早期的階段,肯定需要很多調整。
Koji:我們今天就聊到這裡。2025 年開年第一期,我們聊了很久,資訊量也很大。不過最重要的不只是資訊量,而是希望透過這期內容傳遞出更多樂觀的訊號和情緒,讓大家能多行動起來,多去創造和創作。如果大家想要融資,也歡迎找真格。再次謝謝雨森。
雨森:辛苦了。你剛才的總結說得特別好。在技術浪潮如此洶湧澎湃的時候,雖然還有很多問題和未落地的想法,但這兩年的落地速度確實遠超我的預期。所以我們有很多理由保持樂觀,去嘗試突破。
花足夠多的時間,甚至花一點錢去體驗最新的 AI 產品,感受它可能帶來的一點一滴的進步。這對我們來說都很有意義和價值——不管是作為投資人、創業者,還是單純作為一個對未來充滿好奇心的人。
當然,也歡迎大家多聽聽「十字路口」和真格的「此話當真」播客,這對於我們學習和了解 AI 也會有更多幫助。
Koji:好,謝謝大家,祝大家新年快樂,拜拜。
雨森:祝大家新年快樂。

對 AI 保持樂觀

主持人
戴雨森:真格基金管理合夥人,投資了包括月之暗面在內的多家頭部 AI 公司
Koji:「十字路口」主播,新世相、躺島聯合創始人
時間軸
PART 1: 2024 年
02:19 用一個字形容2024年的感受:「快」
10:06 未來已來,但尚未均勻分佈
11:58 AI 應用落地新要件:幻覺減少、程式設計能力提高、計算機使用
14:35 AI是屬於00後創業者的時代嗎?新一代創業者身上的共性?
17:03 過去一年的超預期進展:預訓練進入瓶頸、Agent落地加速、大模型成本下降
20:50 新的產品形態,將在「強化學習」和「上下文語境」中誕生
26:30 AI程式設計發展四段論:ChatGPT → Github Copilot → Cursor → Devin
30:22 為什麼鼓勵 AI 出海?鼓勵什麼樣的人出海?
32:45 給中國創業者的出海建議:想清楚「做什麼」+「如何推廣」
PART 2: 2025 年
37:02 Devin 為何如此令人興奮?月薪500美金的全能「實習生」
40:37 從 Devin 中,體驗到了怎樣的未來?
42:36 新正規化的特徵:非同步體驗、雲端虛擬機器、知識積累、任務收費
54:47 「Cursor 是程式設計師的Copilot,Devin 是老闆們的 Scaling Law。」
01:05:08 對AI保持樂觀:人、模型、產品,PMF 磨合仍需耐心
01:11:27 2025年,什麼應用方向更容易落地?創業邊界在哪裡?
01:17:16 暗含潛力的新技術浪潮:Agent、可拓展個性化、o3
01:30:08 生成式 AI Native 的大機會長成什麼樣子?
01:33:30 2025年,投資人的共識與非共識
相關推薦
Devin:https://devin.ai/
https://www.cognition.ai/blog/introducing-devin
https://mp.weixin.qq.com/s/nOpZtRoTaN65W4spUytWLQ
OpenAI o3:
https://mp.weixin.qq.com/s/BdLjKBa2VxoE5Nxh4WuBdQ
https://arcprize.org/blog/oai-o3-pub-breakthrough
https://mp.weixin.qq.com/s/MJlJ1hdN9oYhL9xZK9HR9Q
你可以透過小宇宙、蘋果 Podcast 、喜馬拉雅收聽我們。如果你對節目有任何的建議與期待,歡迎在留言區互動~
如果你有任何的創業想法或是有合作的想法,歡迎發郵件到 [email protected] !

推薦閱讀

