LLM競賽2025:超越Google之路

訪談:張小珺,李廣密
「全球大模型季報」是「海外獨角獸」和「張小珺商業訪談錄」的 AI 領域觀察欄目。以季度為單位,拾象 CEO 李廣密和財經作者張小珺梳理行業 AI/LLM 領域的重要訊號,預測未來。本期內容是跨年特輯,除了總結 2024 年 LLM 領域的變化,也對 2025 LLM 的演變作出了預測。
2024 年的 LLM 競賽是算力、模型和應用三條線並行。正如我們在 2024 年跨年對談中所預測的,上半年,LLM 競賽格局基本確定,到了下半年,隨著 Sonnet 3.5  經驗的 coding 能力、 o1 模型以及 RL 正規化的接連出現,LLM 不再是單一的基建競賽,LLM 的應用範圍在擴大、對現有工作流改造的深度不斷增強。
2025 年的核心主線一定是 coding 和 agent 。Andrej Karpathy 在 2017 年提出了 Software 2.0 的設想:1.0 時代的軟體是把結構化、規則化的工作進行數字化封裝,2.0 時代的軟體則對 domain knowledge 和工作流進行封裝重組,背後變化是如何更加動態地編排軟體。這一預想一定會在 2025 年被落地,Agent、multi-agents 不僅會帶來新的軟體,也會對生產力任務進行重組。
網際網路最本質的是對資訊的重組,“Google” 是在“分發”這件事上最具代表性的符號,我們認為,今天 AI/LLM 的競爭同樣也是一條超越 Google 之路:底層模型及其上層的超級應用是對 token 和智慧的重新分發,以 ChatGPT、Perplexity 、Devin 為代表的應用最終將走向所有資訊、內容甚至任務的 All-in-one 的分發容器。
💡 目錄 💡
01 競賽的目標:爭奪下一個 Google
02 ChatGPT 如何跑通商業模式
03 下一個 Google 可能是超級助理
04 AI 競賽賽局盤點
05 2025 年關鍵預測
01.
競賽的目標:爭奪下一個 Google
張小珺:今年的跨年特輯我們還是從 AI 界明星中的明星 OpenAI 開始聊起。關於 OpenAI ,我聽到過兩種說法:一種說法是,他們是一個期貨公司,隨著預訓練 scaling law 的金礦挖完,他們的領先技術也到頭了;另一種說法是,不能低估 OpenAI 的實力,它是一個了不起的公司,還藏了很多牌。你怎麼看這家公司?過去 6 個月認知有沒有發生過變化?
Guangmi Li:ChatGPT 官方公佈的 WAU 周活已經過 3 億了,對應 5-6 億的月活,明年這個時候可能 10 多億月活,這個增速是全球所有科技產品當中,歷史最快的,還超過了 TikTok 之前的增速。TikTok 大概用了 4-5 年時間做到 5 億多月活。
確實 ChatGPT 營銷或 hype 因素存在,但背後意味著什麼?最本質的問題和認知變化最大的是 “下一個 Google” ,ChatGPT 是在往下一個 Google 方向走,無論 Anthropic、xAI、Perplexity,甚至國內的豆包、Kimi,還是做 coding 的 Cursor、Devin,雖然大家形態有差異,從不同的路徑發散,最後都是殊途同歸,收斂在下一個 Google 的敘事下。AI 公司的對手和目標並不只是 ChatGPT,而是如何 beat Google,這是最大的牌。我也不覺得 OpenAI 會刻意藏什麼牌,下一個 Google 就是一張明牌,比拼資金、GPU、人才、產品、品牌的綜合能力。
張小珺:這個很有意思,因為它回答了一個非常重要的問題:基座大模型和基於基座大模型的這一波產品,他們到底在爭奪著什麼?
Guangmi Li:爭奪下一個 Google。 
怎麼理解下一個 Google ?如果大家來矽谷的話,一定要去逛計算機歷史博物館,轉完一圈就很能理解計算架構和資訊分發這一主線是怎麼演變的。最早,是雅虎的門戶模式:人工編輯、 listing,最小單元是網頁。門戶模式只能 listing 頭部的網頁,所以非常有限。後來,出現了 Google index ,網頁用關鍵詞搜尋的模式,重新組織了資訊分發。
紅杉美國最早投了雅虎,後來投了 Google。Mike Morris 當時有一次分享提到,最早希望 Google 能幫雅虎更好覆蓋長尾網頁的內容,因為長尾的內容是隻能透過關鍵詞模式被啟動觸發的,這就需要對整個網際網路做 index。這裡很有意思的是,做門戶的人當時都覺得 Google 這種關鍵詞搜尋是做不大的,但 Google 也是從雅虎的邊緣市場做起來的。一定要重視邊緣市場起來的公司,往往偉大公司都是從邊緣市場做起來的。
順著資訊分發往下講,資訊分發中間有一個演變叫推薦引擎,根據使用者的行為做投票。其實,人是變得更被動了一些,AI 更主動做推薦,最小單元從網頁變成了內容。
位元組也一直在超越 Google 的路上。這兩年開始了搜尋和推薦融合的一體化,從小紅書這個產品能看到一些影子。小紅書非常有意思,包含了社群、資訊流推薦、短影片、圖文、多模態,目前已經高質量的搜尋引擎,這個融合了搜尋推薦問答的形態,未來做任務一體化會更有意思。
今天的大模型,最小單元比網頁更小,最小化的原子是 token。Token 背後是人類幾千年抽象的智慧,因此,大模型是重新組織了智慧,未來會以 agent 或做任務的形態輸出。最後會是一個任務引擎,完成 Task Automation。未來, ChatGPT 融合了搜尋、推薦、問答、做任務等等功能,而不只是目前的形態。過去幾十年,網際網路把零售和線下的東西搬到了線上,未來,人類更多的工作流和任務會走向最佳實踐進行自動化。
目前 ChatGPT 形態太初級,未來一定是融合性的產品,模型也會更主動,像一個助理。模型也可以在後臺一直長時間思考,比如幾小時、幾天,甚至更長。人類目前學會東西后,會即時更新了自己大腦,模型後面學到人類的新知識,也可以即時更新到自己的神經網路裡面。此外,模型的學習效率有可能比人還要高。
張小珺:你剛才說未來會以 agent 或做任務的形態輸出,我目前還在想,要是有一個會做飯的機器人就好了,它可以透過預訓練學會各種各樣的菜譜,做做飯的任務。你覺得它能做到嗎?
Guangmi Li:是能做到的。但廚師的最佳實踐是沒法被傳承的。如果AI 的學習效率變得很高,它能把頂級大廚的手藝學回來,那最佳實踐就被抽象成了演算法,大廚的 task automation 就完成了。但前提是要有反饋,什麼樣的菜做出來比較好吃?這是一個獎勵模型。
張小珺:這個獎勵模型還是一個封閉系統,是相對好給出的?
Guangmi Li:這個應該比較簡單,但是難在機器人難做。
張小珺:你除了提到 OpenAI,還提到另外兩家公司,一個是 Anthropic,一個是 Perplexity。它們目前長得和 OpenAI、和 ChatGPT 是很不一樣的,但他們也都在爭奪下一個 Google 這張牌嗎?
Guangmi Li:是的,大家都在計算架構和資訊分發這條主線下,都是同一個技術槓桿,因此都是殊途同歸的。雖然形態和商業策略肯定有差異,但 OpenAI 正在把自己變成一個 killer app,也是目前唯一的 killer app,在 C 端一騎絕塵。但 Anthropic 正在走向一個 AI 時代的 OS 作業系統的路徑,站住了 coding、協議,尤其是最近釋出 MCP 的 context。  
Perplexity 最大的創新是重新定義了 AI 搜尋形態,其實是 AI 在幫使用者使用搜索引擎, Perplexity 其實是一個 agent,使用者可以圍繞一個主題一直追問、互動。互動是很關鍵的, AI 可以和整個網際網路網頁互動了,而不只是一個靜態的網頁和內容的輸出。產品層面,最終大家都會變成任務引擎,或任務容器。這個任務引擎是我邏輯中下一個 Google 的幻想。
張小珺:任務容器和任務引擎是一個概念嗎?以前大家會叫內容容器,今天是用任務來替換內容?
Guangmi Li:還是一個概念,主要是因為目前還不好去定義它的具體形態。其實今日頭條就是一個內容容器,微信也是一個內容容器,它們也都是一個瀏覽器。未來 AI 最大的趨勢是做任務、完成任務,尤其是有經濟價值的任務。
以前生成的最大的是內容,未來 AI 生成最大的是任務、agent、工作流。比如,我目前研究二級公司的股票,我怎麼去尋找資訊、處理資訊,怎麼去溝通、拆解?AI 可以幫我 automate 出來一個投研的 workflow,而不是幾十個人在幫我開發 workflow,這就是我的一個投研的 workflow agent。
張小珺:爭奪下一個 Google,一定是需要自己自研基座大模型嗎?有可能在別人的模型上蓋房子嗎?   
Guangmi Li:我更相信端到端、full stack 策略的勝算更大,當然這樣的要求,投入的資源也很大。即便看 Perplexity 現在發展很好,它其實很難向下大幅改動模型,或搜尋的 index。但 Google 的端到端最佳化能力是很強的,可以向下改 TPU,改 Transformer。端到端最佳化是非常重要的,Apple、Tesla、微軟都是端到端 Full Stack 的公司,微軟從 OS 向上做了 office 這些 killer app 。但這也不代表 OS 公司一定能做好 killer app,微軟也沒有做好瀏覽器或者搜尋這兩個 killer app,這個問題其實不絕對,存在即合理。
02.
ChatGPT 如何跑通商業模式
張小珺:ChatGPT 的 C 端為什麼增長這麼快?
Guangmi Li:從第三方資料也能看到,ChatGPT 從第二季度開始明顯加速。尤其是在 GPT-4o 釋出之後,單個季度能漲 1.4-1.5 億 MAU。
我自己的感覺:最大的變化是 ChatGPT 放開了不用註冊就可以使用的許可權,背後是模型的 inference cost 降到了很低,不然一般模型公司是吃不消的。此外,OpenAI 又推出了語音模式、推出了 o1,背後其實還有模型能力的提升。ChatGPT 使用者資料量比較大,大量的使用者在用的情況下,使用者偏好資料、使用者投票會讓整個使用者體驗變好。
張小珺:從商業模式上,ChatGPT 應該做廣告嗎?
Guangmi Li:如果我是 Sam,我一定會做廣告,但 ChatGPT 不一定適合做廣告。這個問題本質是商業效率的問題,我們可以簡單算個賬:ChatGPT 是一個典型的工具類產品,工具類產品付費率到 5%已經是非常優秀了。ChatGPT 的付費使用者是 20 美元一個月,按 5%的付費率,一個 MAU 就是 1 美金,剩下 95%的人其實是不付費、不貢獻商業收入的。但我感覺 ChatGPT 付費率肯定到不了 5%,大概是 0.5-0.6 美金每個 MAU。
每個 MAU 橫向對比,網際網路產品如抖音、淘寶、微信都是幾百億美金甚至千億美金營收的產品,10 億的月活,每個 MAU 每年就是 100 美金,每個月就是 8-10 美金。所以傳統網際網路產品比 ChatGPT 的變現效率是高出 10-20 倍的。
雖然 ChatGPT 現在有 200 美金,甚至 2,000 美金的定價,但如果定這個價格,付費率肯定也是會下降的。第一,能付 200 美金或者 2,000 美金的人很少,第二,也存在競爭問題,因為 Claude、xAI、Google 都在後面,競爭問題的存在使得很難定過高的價格。
AI 的商業變現效率這個問題是很關鍵的,不然後端成本每年 5-10 倍的上漲,但前端帶不來營收,是不能持續的,歷史上任何的偉大公司背後都有一個極強的商業模式驅動。
張小珺:這兩年每百萬 token 的成本是在下降的,為什麼說後端成本有每年 5-10 倍的猛增?
Guangmi Li:是的,這個是符合咱們之前預測的,token 這 1-2 年應該降了十幾倍。後端成本猛增主要還是買 GPU。其實去年大家手上的卡是不多的,今年全球第一梯隊公司才到了 10 萬張卡,但 10 萬張卡是不夠的。有可能到一個量級之後不再猛增,但現在還在一個高速猛增的階段。
張小珺:為什麼 Chatbot 不適合做廣告?
Guangmi Li:Google search query 裡面 40-50%都是導航類的 query,一個關鍵詞來了,Google 就直接給你導航到某個網頁,例如電商、娛樂、旅遊、訂票,廣告主是透過網頁提供服務的,Google 導航過去就能賺到錢,這個商業模式是非常好的。抖音、淘寶的商業模式和 Google 也是一樣的,都是搜尋、廣告系統,這個商業模式效率是很高的,因為有巨大的規模效應。
但 Chatbot 目前的 queries 中,導航類的 queries 是非常少的,大部分都是問答類的 query。對應傳統搜尋引擎中,只有 4-5%的是知識問答,Google 過去也一直能沒能把這 4-5%的知識問答 query 商業化。目前為止, ChatGPT 還是沒有本質上影響 Google 的基本盤。因為廣告主還是不會來 ChatGPT 投廣告獲取流量。
張小珺:ChatGPT 未來怎麼掙錢?
Guangmi Li:一方面,最大規模付費的來源還是來源於商戶。因為商戶是廣告主最能 scalable 的物件,廣告主要對消費者提供服務。另一方面是要探索新的商業模式,比如說按照任務付費,最後按照任務完成率付費。
電商是按交易付費的。過去,網際網路電商最核心的一個指標叫 GMV,訂單轉化率。AI 時代最關鍵的北極星指標是任務完成率,本質上要完成有經濟價值的任務。只要價值足夠厚了,肯定還會有全新的商業模式出現的,按照 value-based 去 pricing。例如抖音,催生了新的商戶,內容創作者如果能創造內容本身,這就是服務了,未來新的服務可能就是大量的應用軟體或者 agent 提供解決各類任務。
張小珺:你怎麼看 OpenAI 人才流失的問題?
Guangmi Li:組織能力出了一些問題。ChatGPT 目前的成功,很大程度依賴 OpenAI 最早非常強、非常領先的 research 能力。早期技術遙遙領先帶來了心智和品牌的紅利。
但 OpenAI 過去一到兩年並沒有很好的接住技術紅利,最典型的兩個地方是搜尋和 coding,搜尋和 coding  OpenAI 目前都不是明顯的第一名。
搜尋是很重要的,因為是一個高頻、高粘性的 feature,ChatGPT 自己竟然沒有做很好,是非常不應該的,給 Perplexity 留了完整兩年的視窗,不然 Perplexity 也不會做這麼大。而 coding 能力還是被 Anthropic Claude-3.5-Sonnet 反超了。最開始我以為 OpenAI 不太重視,但過去半年了還沒完全追上,導致 coding 裡大量的開發者已經遷移到 Claude-3.5-Sonnet 生態了。因此 OpenAI 肯定是組織出了一些問題的,那麼多老人都離開了,不是一個很好的事情。
大家都說 Google 的組織問題很大,但 OpenAI 的組織問題其實也很大。
張小珺:Chatbot 現在這個產品形態會是一個過渡性的產品形態嗎?還是最終的形態?如果是過渡,未來會有什麼新的形態?
Guangmi Li:Chatbot 大機率還不是提取智慧最有效的互動方式,但是目前唯一有效的形態。因為 chatbot 的適用範圍廣、相容性強,未來肯定還是需要更不一樣的形態的。目前,大模型的智慧水平已經挺高了,比如我幻想我的面前就是一個 AI 瀏覽器,或者一個巨大的白板、一個任務看板,很多的任務都在上面執行,有 Todo list 、各種圖表,只需要我來確認和指導下一步怎麼做,圍繞某個 topic 可以無限的展開。
還是需要一個好的產品形態來降低使用者的門檻,今天, ChatGPT 對話門檻是比較高的,有時候我面對 ChatGPT、Claude,我不知道怎麼提問。如果模型能更主動的告訴我如何提問,我會更容易的下手。例如現在我們下載抖音、小紅書,就能直接用起來,因為系統會主動給使用者推薦。單一的 chatbot 大機率不是 AI 的最終形態,模型可以更懂使用者的需求,不需要跟使用者對話,就可以猜到使用者的意圖。比如,讓模型閱讀我過去幾個月 Chrome 裡面的瀏覽記錄,它就有了更多的上下文的 context,這樣就會更懂使用者了。
今天, chat 的形態其實是限制了上下文的長度的,一定程度上降低了模型的智慧,長期來看,越聰明的模型越不需要跟人對話,AI 未來需要自動的採集使用者的行為資訊、上下文,變得更加主動,像抖音和淘寶主動給我推薦商品一樣。
張小珺:僅是對話這個產品本身,而是它也是提取智慧的一種方式,這個很有意思。
Guangmi Li:它有 context,context 是一個特別重要的東西。
張小珺:OpenAI 把技術有五個分級,第一級就是現在的 Chatbot 聊天機器人,用自然語言進行對話的人工智慧。第二級是推理者,大概是 o1 這種可以解決人類級別智力性的問題。第三級是 agents 智慧主體,它能夠有代表使用者採取行動。第四級是創新者,第五級是組織者。你怎麼看這個分級?它會是產品形態演變的一個主要線索嗎?
Guangmi Li:我覺得這個分級標準非常好,應該把它作為一個主線的線索去思考產品形態演變。現在我們可能處在Level 2 和 3 之間,所以明年最期待的是 agent 落地。
我覺得還有兩個思考角度,第一個角度,可以畫一個企業的組織架構圖,AI 的能力是從下往上一直進化到 CEO 那一層。另外一個角度,是再把企業內部的能力做拆分,比如程式設計能力、設計能力、溝通能力、銷售、尋找和處理資訊的能力、資料分析能力,AI 也會橫向逐個替代掉。一個是從下往上替代,一個是橫向替代,對應這五個分級。短期做到替代一個企業的 CEO 層面還是比較難的,但兩年左右的時間做到一個 manager 水平是有可能的。
張小珺:Managers 能等同於 agent 嗎?
Guangmi Li:長距離、多步推理任務如果能落地,那就會超過 90%的 manager。我覺得 25-26 年是看得到的。
張小珺:這些 AI 如果進入組織的話,它是跟人配合工作還是能夠獨立完成工作?
Guangmi Li:肯定還是需要人配合的,但是它能完成任務的數量會大幅提升。
張小珺:剛才提到要模型更主動,能增加人的互動,也能夠幫助 AI 提取智慧。怎麼讓模型更主動呢?
Guangmi Li:一方面是產品形態怎麼設計的更好?可能的形態是個人助理或超級助理這個形態,助理是更主動的。更重要的是技術架構,尤其是 context。
我覺得 99%的從業者目前都只盯著模型的生成能力或者 coding 能力,但更加核心的是 context 的採集能力。如果沒有 context 的同步,絕大多數的任務成功率都非常低的。context 是非常重要的,絕大多數人可能還沒意識到。例如,再厲害的主任醫師,如果沒有體檢報告、健康資料、檢查報告,也很難跟聊幾句就下診斷。
Context 就是各種背景上下文資訊。這是一個關鍵的暗線。之前的暗線可能是 RL、cost,而今天的暗線愈發清晰是 context。
張小珺:相當於誰能獲得更多的 Context ,誰的智慧水平提升就會更快。Context 可以展開講講嗎,以及 context 可以透過什麼形式獲得?
Guangmi Li:有一個簡單的比喻:Context 是新時代的支付。之前紅杉中國投電商的時候有一個非常精闢的認知:電商的兩翼是物流和支付,這是兩個最基礎的商業基礎設施。如果沒有這物流和支付,其實網購體驗會非常差,買東西的成功率是非常低的。
AI 的模型幫使用者做任務的成功率的高低不完全取決於模型的生成或者 coding 能力,更取決於 context 是否充分的同步了。例如,要做一個個人的 agent、網頁,使用者很難告訴模型各種 prompt,描述半天也沒辦法把個人 agent 或者網頁做好。但是如果同步使用者的個人知識庫、個人的軟體資訊,AI 還可以用搜索引擎去搜網上相關的資訊,這樣做個人的 agent 或官網是更容易成功的,因為它有更多的資料、context。純語言 prompt 成功率是很低的。
此外, context 獲取資料同步應該是自動化的,而不完全是透過人工 prompt。比如我們有一個 claude bot 在 slack 裡面,一直默默的跟蹤我們怎麼做投研、怎麼討論各種話題、怎麼找資訊,怎麼與人溝通。某一天,我再交給它一個任務,它有各種上下文,溝通成本就非常低了。時間長了後,讓它幫我做一個怎麼做投研的 workflow,它就可以自己總結出來,這就是慢慢沉澱投研的最佳實踐工作流。
張小珺:這種情況下使用者個人隱私問題怎麼辦?
Guangmi Li:目前,我們所有的資料都在網際網路上,我們會真的關注隱私嗎?1%的使用者會關注隱私,但是 99%的使用者會被效率和能力吸引。滾滾大勢,阻擋不了。
張小珺:如果 AI 是中心化的 AI,他也知道你的資訊,也知道我的資訊,他會把我的資訊告訴你嗎?
Guangmi Li:所以我認為新時代的安全機會很大。
張小珺:如果 AI 的生成能力增強了,未來會生成什麼?
Guangmi Li:這是一個非常值錢的問題,我的答案是新時代的軟體。移動網際網路增加最大體量的資料是內容,智慧手機可以隨時的創作、消費內容。AI 時代最大的增量資料是軟體。而軟體的本質是什麼?軟體的本質是人類行為的自動化,企業軟體是那些最佳的工作流的自動化。未來的軟體的開發應該是怎麼樣?未來的軟體的開發正規化又會是怎麼樣?
張小珺:SAP 這些公司價值在哪裡?
Guangmi Li:SAP 是過去幾十年整個生產製造業的最佳實踐的工作流自動化,分發給了低效率的地方,這個最佳實踐的自動化是 SAP 重要的用處。但是人類還有特別多的行為、最佳實踐是沒有被自動化的,這會是未來增加的巨大增量。
03.
下一個 Google 可能是超級助理
張小珺:未來的軟體會是什麼樣子?
Guangmi Li:過去,軟體是人為主動定義的,定義一個通用的需求之後交給外包團隊去開發,就像傳統導演拍電影。未來,軟體不一定是人為主動去定義創造,而是日常的 context 自動同步給模型,它自動化的生成軟體。比如, AI 知道我日常怎麼做投研資訊,他就幫我 automate 整個過程,我還可以 share 給我的同事。今天,不可能有一個幾十人的開發團隊專門幫一個人去開發,因為只有單一使用者自己在用,投入產出比就不夠高。
之前播客也有聊到,未來的軟體生成,會不會像目前的短影片內容創作一樣,門檻非常低?有很大機率,我們自己也不知道這個任務怎麼完成,就像平時我交給同事做任務,同事和 AI 都是自己做了很多探索,有自己的規劃,都能更有效的探索出來一個更好的工作流。有一個很值得思考的一個問題:如果 2025 年 AIcoding 能力變強 5 倍、10 倍、30 倍,軟體開發效率提升 10 倍,軟體生產成本大幅的降低,會有哪些機會?
張小珺:當一個軟體面向給普通的消費者的時候,它可能不叫軟體?
Guangmi Li:對,這裡需要好的產品形態定義。agent 到來,coding 能力變強了,需要一個非常重要的產品形態接下來。2011 年的時候,我們去投推薦引擎,投推薦引擎本身是無法賺錢的,但是我們要投資訊流產品,最早的今日頭條,還有後面的抖音。
過去沒有做機器學習和推薦的公司,都沒有成為大公司。但不能外專門為了投 coding 去投 coding,而是投 coding 這個能力象限下,未來可能出現的產品形態。推薦引擎造就了資訊流產品,coding 未來會造就什麼?一方面是服務傳統的軟體開發,另一方面是更民主化、更新的形態的產品。現在需要一個天才來定義新的產品形態,就像之前位元組定義出來資訊流產品的人是絕對的天才。
張小珺:浪地球 2》 裡面劉德華飾演那個角色用 AI 重寫了底層作業系統,這種科幻電影場景裡面是不是也會實現?
Guangmi Li:它發展到你說的第五級了,那個架構邏輯複雜度是非常高的。
張小珺:Coding 和下一個 Google 是一件事嗎?
Guangmi Li:是同一件事,殊途同歸。因為背後的技術底層都是一樣的,都是一個任務引擎,完成各類任務的自動化。
張小珺:為什麼大家在一個新的時代要想的就是下一個 Google,Google 對於網際網路時代意味著什麼?
Guangmi Li:下一個 Google 不是 Google 本身,也不是搜尋引擎本身,而是重新組織資訊本身。過去,門戶組織資訊,搜尋引擎又重新組織了網頁,推薦引擎再次重新組織了資訊。未來,重新組織資訊和 token 變成了大模型這個引擎。
重新組織 token 背後本質是智慧,代表的任務是生產力。淘寶重新組織了商品,下一個 Google 不是做 Google 本身,而是做一個更高效率的東西,解決更厚、更深的問題,提供更大的價值。
張小珺:搜尋、coding 有獨立存在的機會和必要嗎?如剛才所說,ChatGPT 應該是統一的任務引擎、巨大的任務資訊重組產品,那搜尋和 coding 還有獨立成為入口的必要性嗎?
Guangmi Li:不絕對,存在即合理。微軟做了 Windows,那麼上面的  killer app 都應該做好,比如 office、瀏覽器。但是瀏覽器、搜尋都是 Google 做得更好,因此我覺得不完全絕對。掌握 OS 的公司有更強的競爭力,可以端到端最佳化。微軟有企業級的關係,又做了 Azure 雲,它是更有優勢的。當下, Perplexity 和其它的 coding 公司本質上沒有和底層拉開差距,而且過於依賴底層。現在很難下絕對判斷,甚至有可能 Claude 未來就是一個 coding model,往上做 coding agent、做 Devin。如果目前的 GPT、Claude 不做 Devin,肯定又是巨大的戰略失誤。
張小珺:你對 OpenAI 的認知有沒有發生過變化?現在的認知是基於最近發生的事情,還是從第一天就這麼認為?
Guangmi Li:我更多是從投資或商業視角來看。
第一,這個公司的投資回報率怎麼樣?之前我認為 OpenAI 是 AI lab,但是今年下半年 ChatGPT 使用者增長這麼大,開始能算賬了。但現在 1,570 億美金的估值下,看不清楚 upside 有多大。雖然可以拍腦袋說它可能是萬億美金的公司,但現在還是很難有 fact、商業模式、計算財務模型去算賬。
第二,從技術革命演變的角度,認知是在變化的。之前我們每期播客,我都覺得智慧和模型最重要,其他都不重要。但未來兩年,AI 應用端的落、 agent 落地,是非常重要的,最領先的三四家模型可能在模型層面拉不開絕對的差異了。OpenAI、Anthropic、Google 的模型都不錯,Llama、xAI 還在奮力的追趕,但追上來難度也不高,還是要能做出應用差異化。
Anthropic 的  Claude-3.5-Sonnet 模型出來之後,能力和口碑已經超過了 GPT-4o,Claude 的 c 端和 b 端都漲得非常多,但依然還很難翻盤 ChatGPT。ChatGPT 的 c 端心智和品牌效應壁壘太強了。我們身邊 90%的人已經分不清楚哪個模型好了,模型已經比 90%的人尋找資訊和處理資訊的能力更強。
張小珺:行業裡掌握最前沿認知那一批人,對於模型能力、產品的構想,是跑著跑著剛認知到的,還是從第一天就看到了趨勢?
Guangmi Li:絕大多數人是跑著跑著剛認知道的,也有極少數人有自己一直的堅持。Anthropic 的 CEO Dario 很早之前就提出 coding 非常重要,不排除 Claude 就是一個 coding model。他一直很重視的就是 agent 落地,而不是 c 端產品。Dario 認為 c 端產品對推動 AGI 是沒有太多幫助的。今天,Dario 現在的認知肯定也會發生變化,可能覺得 c 端也挺重要的,但他自己是個科學家,做 c 端消費級產品的 sense 沒那麼好。此外,ChatGPT 品牌效應又很強,因此很難翻盤反超的。我們很難預測未來,但可以有自己的信仰和 bet。每個人和每個公司都有不同的信仰或者不同階段最重要的 bet。
張小珺:我們目前有一個特別重要的關鍵詞叫做 agent 落地,但是我對這個詞沒有什麼畫面感,它和目前我們看到 c 端產品是不一樣嗎?
Guangmi Li:Agent 是需要形態的。Perplexity 就是幫使用者使用搜索引擎的 agent,Devin 是更好的幫使用者用好模型做任務的 agent,這是目前相對有一定 agent 雛形的產品。而上一次播客時,我覺得還沒有任何能稱得上 agent 雛形的產品。Devin 的出現屬於 agent 的真正雛形了,大家可以多看看 Devin 的 Demo。
張小珺:OpenAI 的領先優勢是放大的還是縮小的?
Guangmi Li:區域性放大,區域性縮小。ChatGPT 的 c 端,最大的壁壘已經不再是模型或者技術層面了,而是品牌或者心智。這是比技術或者模型壁壘更高的。Claude 模型雖然有些能力比 ChatGPT 要好,但是很難反超,因為品牌是更強大的壁壘,ChatGPT 領先第二名 10 倍甚至更多的數量級。這個領先優勢還是放大的,因為明年做到可能 10 億的 MAU 了。預訓練模型的領先優勢是縮小的,因為天然的收益空間在變小,最主要的原因是公開網際網路的資料快用光了,20-30t 是 text 文字的極限了。
但背後的創新體系領先優勢是放大的,就像好萊塢工業化的電影體系,預訓練環節可能就是 OpenAI 拍的一部電影,而 o1 又是一部電影, OpenAI 能持續的在智慧這條線下做出新東西。這個是其他大公司不太具備的,即便告訴我們這個電影具體怎麼拍,我們也不能完全復現結果。創新的工業體系是最難的,這是 OpenAI 的內功。就像我們每天看足球,研究 c 羅怎麼踢球的影片,把回放看很多次,自己有可能也踢不進那個球。
張小珺:OpenAI 到底會是下一個 Google ,還是下一個網景、施樂?
Guangmi Li:都有機率。OpenAI 要變成一個真正偉大的公司是有一些必要條件的。首先它的架構重組要弄好,如果馬斯克訴訟 OpenAI 只能保持非盈利,那人才肯定要流失。第二,OpenAI 要找到更高效率的商業模式,不然每年 5-10 倍的 CapEX 上漲是不持續的。組織問題會隨著公司快速奔跑而解決,今天 OpenAI 的組織問題不比 Google 小。
張小珺:OpenAI 過去哪些期待過高,哪些期待不足?
Guangmi Li:我們腦子裡能想到很多關鍵詞:比如說 Sam 曾提到的:投入 7 千億美金製造晶片、GPT-5、合成數據已被突破、AGI 的口號等、AGI 背後到底是什麼不重要,重要的是在往這個方向走。這些關鍵詞都期待過高了。但 Sam 對整個行業是好事情,因為給大家爭取了更多的資源,從業者的薪酬翻了非常多,投入的資金也增加了很多倍。出色的人最早都是有爭議的,喬布斯有爭議,馬斯克更有爭議。只要哪天 OpenAI 真正成功了,Sam 的爭議其實都會消去。
智慧技術的價值現在是短期高估,長期低估。智慧到底是什麼?今天如果沒有電,我們晚上就無法工作。智慧能 automate 非常多的最佳實踐,大幅提升人類的生產效率。
張小珺:從投資人的視角來看,ChatGPT 這個產品優秀嗎?
Guangmi Li:從投資人經常看的指標上是挺優秀的。首先留存很好,品牌心智很強,從第三方資料來看,ChatGPT 的長期留存是非常好的,12 個月之後還有 50%。Database 的粘性很高,跟 Notion 差不多,只是目前沒有資料飛輪、規模效應、網路效應,但後面是會有的。
還有一個投資人會經常關注的指標:DAU/MAU 的比例。這個比例不太高。典型的工具類產品是 15-20%,這個會決定使用者一個月有幾天開啟產品。DAU/MAU 是 20%,意味著一個月 30 天中的 6 天是使用產品的。一個月有 6 天代開 ChatGPT ,這個指標是不高的,而優秀的產品都是比較高的。微信的 DAU/MAU 差不多 1:1,抖音一個月使用者會用 20 多天,小紅書也是 20 多天,Google 搜尋使用者每月會用 15-20 天,甚至更多。怎麼把 DAU/MAU 的比例提上去是很關鍵的。
另外,search 類產品使用者每天打開了之後,衡量具體會用幾次是很關鍵的。如果使用者開啟後只用個一兩次,是非常差的。因為搜尋沒解決好問題,而 4-5 次是比較優秀的。未來怎麼把使用頻次和粘性提上去?還會不會有新的產品能打敗 ChatGPT?
目前的心智來看,只是 chat 形態其實很難翻盤,需要透過一個全新的形態佔住使用者的心智。如果商業模式或產品形態問題不解決,目前的 AI 會偏向 SP 移動夢網的時代,還沒有看到 iPhone。基礎設施沒有那麼成熟、沒有支付、沒有物流、沒有攝像頭,就像是高中剛用手機的時候只有圖文。但 SP 時代移動夢網的公司,在走向移動網際網路時,沒有一家轉型成為大公司的,全是全新的公司,不管是字節跳動、美團、還是拼多多,而移動網際網路公司都沒有從上一波留下來。
張小珺:為什麼 LLM 產品的資料飛輪一直比較差?
Guangmi Li:因為使用者帶來的資料平均質量比模型內在分佈的資料質量差。模型預訓練的資料質量很高的,但大部分使用者是沒有模型聰明的,那帶來的噪音就會更多。
張小珺:當於自動駕駛做到一定水平了,但還在給它灌大量普通司機的資料,模型只能變差?
Guangmi Li:使用者的資料更多代表使用者的偏好資料,而不是能力資料。偏好資料不能提升能力。搜尋、推薦,是整個人類在大規模投票,是更準確、更好看的,因為搜尋引擎是偏好即能力,而大模型的能力是另外一種資料。
張小珺:既然 LLM 產品都想成為 Google 已經變成了一張名牌,那 Google 在這個過程中有能力阻止這件事情發生嗎?
Guangmi Li:我對 Google 的判斷也是一直是比較 mix 的。一方面 ,Google 手上的好牌其實非常多,TPU 代表無限的算力,安卓、Chrome 代表最強的分發能力,只是之前受限於兩個問題:第一,組織問題,CEO 能力有限。第二,商業模式問題,因為目前 chatbot 裡面的使用者的 query 變現價值比較低,Google 這種大體量的公司大幅轉向 chatbot 產品形態很難。但搜尋和推薦,其實都是資訊分發,那麼下一個 Google 有可能是超級助理。
資訊分發和超級助理的異同點是什麼?資訊分發是主線,助理也是主線,既會融合,也會競爭。助理是更主動、跟人更 close 的,有更多的 context,能佔據使用者的信任,更多的資料 access。但資訊分發也是一個方向,助理也可以做資訊分發,掌握資訊獲取的來源。但做資訊分發的公司,比如位元組、Google、Meta,也可以從資訊分發走向助理。Apple 的 Siri 有可能也是一個助理,都是同一場仗。
有可能下一個 Google 是一個任務引擎,也有可能是一個助理形態,本質都是一樣的。今天,我們還比較難定義出來助理產品背後的需求。但資訊分發代表什麼?人類最基礎的需求就是要獲取資訊、娛樂,所以資訊分發是一個基礎的需求。但助理形態是哪些需求會被激發出來?這是未來兩三年會能看到的。
張小珺:助理會在手機、電腦上嗎?它還是一個 APP 嗎?APP 的劣勢是我要找到它、點開它。
Guangmi Li:大機率還是在手機和電腦上的,目前還看不到全新的、大眾級的裝置。
它可以幫使用者使用工具,幫使用者使用 APP,離使用者更近。所以, Siri 的位置是特別好的,當然 Siri 的 context 視窗輸入效率還不夠高,可能還是螢幕的效率更高一些。例如目前我們面對面對話效率很高,但如果再代培一個白板、PPT 展示,效率會更高。我會感到一個特別的感觸時刻:從命令列 DOS 時代,突然轉到 GUI ,這就是天才,定義出來 GUI 使用者互動的介面。目前,我們把大模型看成一個新的計算機,需要一個更好的互動。Chatbot 肯定不是完全的 GUI,但它的好處是廣泛相容。
04.
AI 競賽賽局盤點
張小珺:去年這個時候,大家認為大模型公司一定需要技術型的創始人,但目前這個事情不再被那麼強調了,更需要的是一個超級產品經理?
Guangmi Li:超級產品經理如果不懂技術也是不行的。目前, AI 產品都是 post-train 環節決定的,未來的超級產品經理可能是從做 post-train 的人裡面出現的。因為 post-train 決定了模型的各方面的性格、偏好,pretrain 訓練出來,是一個差不多的模型,而 post-train 決定模型性格。在這個基礎之上,需要對互動理解更深,理解什麼樣的互動效率會更高。如果我有一個白板、Todolist,是不是這個產品圖形化的介面會更好?互動效率更高?不只是和 Chatbot 對話,有時候一圖勝千言。
張小珺:下一個 Google ,雖然不是 Google ,你認為會是壟斷公司嗎?市場上會有一家還是多家?
Guangmi Li:我傾向於會有多家公司。今天, AI 產品還沒有規模和網路效應,只有品牌效應。除非哪天跑出很強的規模效應。Google 當時的技術是遙遙領先的,後面又出現了很強的規模效應和網路效應,導致其超高的市場份額。
張小珺:今天,所有人都在打這場下一個 Google 的爭奪戰,目前到達了哪個階段?場上的選手們分別積累了哪些優勢、護城河?
Guangmi Li:紅杉美國最近的一篇文章總結的很好:
• Google 是端到端、full-stack 的垂直整合。
 OpenAI 最大的壁壘是品牌, 綜合能力客觀來說也是最強的。
 Anthropic 強在人才,是全球範圍內最強的 AI lab,佔領了 coding 和協議,和 Amazon 深度繫結,比較安全。Anthropic 可能是未來的 OS。
 xAI 資料中心建設很快,但問題是超大的叢集是否有用?目前還無法回答。這也是 xAI 最大的 bet,萬一賭錯了,就要下牌桌。
• Meta 站穩了開源生態,實際上, Meta 會充分受益於 AI 應用端。
我比較看好 Amazon,它是全球最好的雲廠商,和 Anthropic 關係,相比微軟和 OpenAI 更健康。Amazon 要自研 TPU,確定性很高。可以看到,微軟在向上做應用,Copilot 做得非常糟糕,但 AWS 向下做計算架構,這也是不同的 bet 相比起微軟,我更喜歡 Amazon 一些。
今天看到的結果是微軟過去兩年做產品的能力非常糟糕,微軟最早跟上了 OpenAI 的 hype,但自己的產品做得不好,微軟作為大公司太慢了, Cursor 和 Devin 這種開發者產品都不應該從微軟的手下溜走,但反過來說,微軟還是最後的贏家,因為銷售和繫結能力太強了。即使今天錯過了機會,它不一定需要從 0 到 1 的開發,但最後透過收購或者抄襲同樣可以領先。比如 Teams 和 Zoom,還有安全方面的 Okta,最終都可以追回來。
Apple 握著最好的牌,但還不知道怎麼打。從估值角度 ,Apple 的股票一直不便宜,說明大家對它預期很高。
小公司層面, Perplexity 搶跑了,佔住了一些品牌、心智效應,也有一定規模。每天使用者搜尋 Query 量級已經大概是 ChatGPT 的一半了,雖然對比的只是 ChatGPT 搜尋的 query,不包含其他 query ,但這個量級也不小。我認為 Perplexity 明年被收購的可能性很大,任何一個平臺公司都不能錯過搜尋。搜尋非常關鍵,第一,平臺可以在前端收集使用者意圖,意圖資料對於平臺極其重要。第二,搜尋會重塑後端的技術能力。
Cursor 、 Devin 這些面向開發者群體的產品同樣是搶跑選手,產品做得非常好。這些公司和微軟以及底層模型的關係非常重要,因為競爭威脅主要來自微軟和兩個模型廠商。
張小珺:現在看起來除了 OpenAI 的 ChatGPT,其他的大模型產品和明星專案都是搶跑型選手,可能會護不住自己的領地?
Guangmi Li:小公司的創業者一定要搶跑、跑得快。一定要形成規模效應或者網路效應,才能贏得競爭並形成壁壘。
張小珺:後期他們會需要和大廠繫結或者被收購嗎?
Guangmi Li:這個問題並不絕對,有些需要繫結,有些不需要。
小珺:你怎麼看 OpenAI 和微軟長期的關係?
Guangmi Li:可以稱為同床異夢。雙方都有不同的想法,不像 Amazon 和 Anthropic 的關係那麼簡單健康。微軟和 OpenAI 分家的機率不小,如果分家了,微軟自身的 AI 能力其實很差,所以會有麻煩。如果我是微軟,我一定會投 Anthropic,這樣反而更互補。
張小珺:但如果微軟投了 Anthropic,可能會加速和 OpenAI 的破裂?
Guangmi Li:未來所有的模型都會部署到所有的雲上。Anthropic 更像一個 OS 廠商,而微軟的主線一直都是 OS。微軟是可以承受搜尋,比如 Bing 輸掉,但 OS 是不能輸的。
OS 和 OS 之間是相吸的。Windows 、Azure 和 AWS 兩朵雲、安卓和 iOS ,其實都是 OS。模型就是新的 OS。OpenAI 和 Anthropic 是有分歧的,OpenAI 要做最大的 killer app,Anthropic 要做一個 OS。OpenAI 可能端到端都會做,killer app 也做,OS 也做,但可能不夠專注,沒辦法做好 OS 本身。
張小珺:DeepSeek 是想走 Anthropic 那條路嗎?
Guangmi Li:大家都沒辦法在 C 端像 ChatGPT 有強品牌心智,所以只能講 Anthropic 的故事。DeepSeek 也不像 xAI 有很強的資源,那要麼需要在某個能力上極其領先,比如 coding 和別的能力,或者在另一個新產品形態下變得更好。
張小珺:接下來我們來聊聊除了 OpenAI 之外的這幾家公司的產品。你過去半年對於 Anthropic 有怎樣的認知變化?
Guangmi Li:Claude-3.5-Sonnet 是專業開發者群體認為最好的群體。從 6 月 20 號釋出 Sonnet 後,我身邊很多人從 GPT 轉向了 Sonnet,因為 Sonnet 的 coding 能力非常強。coding 對拉動 API 的營收增長是非常明顯的。評估模型能力最核心的指標就是 coding,因為開發者不會撒謊,而是真金白銀投票,coding 也是影響 reasoning 能力。我的總結是得 coding 者得開發者,得 API 消耗,有機會得到生態做 OS。
Anthropic 另一個好處是管理層非常穩定,不像 OpenAI 這樣 drama。公司還持續從 OpenAI 挖人。未來一段時間還能看到更多高水平的人從其他模型公司轉向 Anthropic,人才流動還是一個比較關鍵的訊號。
張小珺:Anthropic 釋出的 computer use 功能對於市場後續的影響是什麼?
Guangmi Li:這個功能今天還有一些 demo 或者噱頭為主的成分在。Anthropic 先發出來,佔住先發的心智。今天其實準確率還不高,但提升比較快。Computer use 可以被理解為模型的 action、執行的環節,也可以說它是新的瀏覽器,或是任務執行器。Action 是每家模型公司必做的,只是 Anthropic 搶先發布了。此外, computer use 是多模態技術落地最重要的 case 之一,因為模型要理解後臺的截圖、螢幕裡面的資訊。
我比較喜歡 Anthropic 的 Artifacts ,它像一個新的 browser。Browser 可以理解為一個任務容器,使用者看到的任何東西都可以編輯、拖拽。今天還是很初級的應用,但未來的空間非常大。
大家可以重視一下 Anthropic 新開源的 context 協議標準:MCP,它是協議層,長期影響會比較大。
張小珺:Anthropic 和 OpenAI 最大的差別之一是 Anthropic 對 c 端投入不是那麼重視,他們接下來會加大對於 c 端產品的投入嗎?
Guangmi Li:是的,Anthropic c 端確實比較弱,但是 c 端收入體量並不小。主要原因是管理層太過科學家背景,CEO Dario 之前不太重視 c 端,認為 c 端對於實現 AGI 沒有太大幫助。今天來看確實幫助不大,但是對於分發模型有幫助,未來一定會被重視。
ANthropic 也開始投放廣告了,但是科學家背景的管理層可能對 C 端產品的 sense 不強,加上 ChatGPT 太強了,還是很難翻盤。Anthropic 的 CPO Mike 之前是 Instagram 的產品負責人兼 CTO,Mike 還是現在 OpenAI  CPO Kevin Weil 的老闆,可能他的產品能力比 OpenAI 更強一些,但是 ChatGPT 的心智和品牌效應確實更強。
張小珺:OpenAI 有很大的先發優勢。你今天怎麼認知大模型和 C 端產品的關係?
Guangmi Li:這幾個 AI Lab 不一定能做出最強的 killer app,但想要 killer app 長期保持競爭力,還是需要端到端的垂直整合能力,向下最佳化成本、模型、模型架構等。模型變小後要最佳化模型資料的分佈,甚至未來會向下最佳化硬體到晶片。端到端垂直整合是 killer app 長期要做的事情。
Anthropic 會更專注在 Agent。如何讓 agent 落地是 Anthropic 在 bet 的事情,可能 agent 也會落地到 ChatGPT。OpenAI 今天最大的 bet 就是把 ChatGPT 的 C 端持續做大,做到 10-20 個億,未來 OpenAI 的生態就長在 ChatGPT 上。
我覺得 ChatGPT 未來有可能成為全球最大的 killer app,DeepMind、Anthropic 未來可能成為全球最強的兩個 AI Lab,Anthropic 也可能成為 AI 的 OS,在 OS 之上會長出新的軟體、agent。我認為更重要的是 DeepMind 和 Anthropic 的兩位 CEO 站在了人類的角度思考問題,比如 AI for Science 可能成為他們的 killer app。我更欣賞他們的願景,比如消滅疾病、讓人類壽命增加到 150 年。
張小珺:xAI 呢?
Guangmi Li:xAI 的團隊剛超過 100 人,但 OpenAI 有 2,000 人,Anthropic 1,000 人,相比之下, xAI 的團隊是非常精簡的,可以說是人手不夠用。估值過高後招人會變得困難,因為很多人會考慮股票的彈性空間。
xAI 是全球範圍內最快部署上線 10 萬卡叢集的公司,OpenAI 或 Anthropic 都沒有這麼大的單一叢集。馬斯克還要上線更大的叢集,所以 GPU 資源是非常充裕的,對訓練是足夠的。但本質問題是,不確定 GPU 超大叢集是否會帶來質變。Grok 今天還沒有追上最新的 3.5 Sonnet 或者 GPT-4o,但進步速度非常快,這個公司成立很短的時間內訓練了幾代模型都非常成功,幾乎沒有失敗。我認為下一代 Grok-3 或許可以追平最高水平,甚至反超,或者在某些能力上做得更好。
我認為 xAI 有兩個大的 bet:
一方面是我們都看到的幾十萬卡叢集,有可能帶來新的能力湧現。但幾十萬卡叢集到底是否有用,今天沒有人知道,也沒有人試過,試錯成本太高。
其次是多模態,因為 FSD 已經被驗證了。他們是相信多模態的,但坦白來說沒有任何依據支援多模態可以提升智慧。今天科學界的共識也是多模態不提升模型的智商,因為它資訊密度比較低,單個畫素的資訊不會對智慧帶來任何提升,而且訓練多模態的 infra 投入也比較大。大家在語言上投入太多,多模態上面投入佔比較小,馬斯克可能認為其他人再多模態上面的投入較少,如果給足投入會有更強的智慧湧現。這也可能是 xAI 的一個 bet。
但 xAI 想勝出還是需要差異化,像 Anthropic 一樣,從 coding 這類某個能力象限勝出。需要有差異化才能勝出,或者 xAI 直接把 Perplexity 收購了,專注做搜尋。xAI 目標或許也不是 OpenAI,最後也是對標 Google 使用其他的形態做資訊分發,和 Twitter 一起做更主動的推薦。xAI 最終註定是可以成功的,但有多大的 upside 還不清楚。
張小珺:什麼時候能看到 xAI 這兩個賭注的結果?
Guangmi Li:明年肯定能看到。
張小珺:你怎麼看 Elon Musk 的公司?
Guangmi Li:他的公司今天有一些比特幣化,不要算賬,也算不清楚,算賬就輸了。馬斯克的公司都是他的粉絲或者散戶買單,更好聽的說法是為夢想買單,因為傳統機構很難做出財務模型過 IC。馬斯克的位置對中美關係很好,也或許可以更好地處理 TikTok 的複雜問題,是中美關係更好的橋樑。如果 TikTok 安全著陸,它與 xAI 的深入合作對 xAI 未嘗不是一件好事情。
張小珺:那麼 Perplexity 呢?
Guangmi Li:其實 Perplexity 不是自己做搜尋引擎,它沒有自己的模型、index,而是能夠幫助使用者更好地使用搜索引擎這一工具。Perplexity 更像一個資訊處理的 agent。覆盤來看 ,Perplexity 有兩個點做得比較好:第一,它真的把 AI search 的體驗做好了,贏到了使用者心智,第二,它重新定義了 AI 搜尋的互動形態,可以追問、互動。Google 只是靜態的導航,AI 這一代產品的互動性非常重要。
這一波技術浪潮下,我最喜歡的 AI native 產品就是 Perplexity 和 Cursor,還有 Devin。他們的共同點是預判對了模型進步的方向,所以接下來預判智慧進步的方向非常重要。
張小珺:除了 Perplexity,另一個很火的 AI 應用產品 Cursor 呢?
Guangmi Li:Cursor 是成長非常快的產品。Claude-3.5-Sonnet 6 月份釋出後,Cursor 7 月份就釋出了,從 7 月到現在,它的 ARR 從 0 漲到了 7000 萬美金,甚至更多,明年有希望做到 2-3 億美金的 ARR 。Cursor 的新一輪融資公佈了,25 億美金的估值,我覺得是合理的。coding 的產品形態需要快速迭代,之前 Github Copilot 是在補全下一個程式碼,現在 Cursor 可以補全下一個 action,明年或許就可以端到端的生成軟體了。
張小珺:你剛才說了好幾次的 Devin 怎麼樣?
Guangmi Li:我認為 Devin 是第一個真正意義上處理長距離複雜任務的 agent,具備了幾個重要 agent 雛形的要素。第一,它可以在後臺工作,第二,它可以做多步驟長距離的任務,第三,它可以在過程當中根據反饋做出自己的決策,第四,它可以使用工具,比如瀏覽器、搜尋引擎等。明年或許最有價值的產品就是處理長距離、long-horizon 的 task。
張小珺:Mistral 呢?
Guangmi Li:我覺得 Mistral 不用太多關注了,他們預訓練已經掉隊了,後續只能在 Llama 的基礎上做 post-training 更適合。
05.
2025 年關鍵預測
張小珺:25 年的跨年相比 24 年聊應用的篇幅比模型多出許多,你之前對 AI 大模型的很多預言事後都驗證了,延續我們大模型季報的特色來聊聊對未來 25-26 年的一些關鍵判斷。剛才聊到智慧進步,方向非常重要。未來智慧還會進步嗎?25-26 年有哪些比較重要的方面?
Guangmi Li:智慧百分之百會進步,只是它的智商可能不會像 80 提升到 120 這樣迅速,可能是從 120 到 125-130 的提升,但更重要的是它可以幹活了,我對 25-26 年最大的期待就是 agent 可以落地,尤其是長距離多步驟的任務,long-horizon task。
矽谷核心圈子的大佬級別的人物都在做類似的事情,比如 OpenAI 的 CTO Mira 離職後也在做 long-horizon agent。也可以類比 Perplexity,Aravind 當年離職後想做的是 RAG-based search。Long-horizon 的 task 落地是 agent 創業最核心的方向,包括最領先的模型公司,比如 OpenAI 和 Anthropic,都花了很大精力訓練 long-horizon task。其實可以理解為做一個更復雜任務的 agent。
張小珺:做長期規劃的智慧體難點是什麼?
Guangmi Li:要求的準確性非常高,對工程能力要求也很高。大家可以研究一下 Devin,他是一個作為長距離 agent 比較好的樣板。
張小珺:明年 AI 應用會遍地開花嗎?
Guangmi Li:我對明年 agent 落地或局部落地比較樂觀。26 年會更大範圍地遍地開花。Anthropic 的 MCP 和 Claude-3.5-Sonnet 模型都比較專注讓 agent 落地,包括 OpenAI 的 post-training 團隊也分了很大精力支援 agent 落地。OpenAI CTO Mira 的新公司也在做。
最近 Devin 產品的 demo 在看了朋友的體驗後,我認為還是很驚豔的。Cursor 最近也釋出了 agent 模式的產品,agent 是各個重要的 agent 公司明年發力的重點。
張小珺:明年除了 agent 很重要,還有哪些重要的關注點?
Guangmi Li:產品形態的探索,是否會有一個全新的互動介面?比如 chatbot 今天的形態沒辦法釋放 o1 模型的能力,也不太適應攝像頭、多模態的能力。
AI 最關鍵的基礎設施到底是什麼?當年電商最重要的基礎設施是物流和支付,AI 時代新的商業基礎設施是什麼?是不是 context?今天, AI 的商業模式還停留在 SP 移動夢網的時代,依然是扣費模式,後面需要更強的商業模式覆蓋後端成本。Cursor 雖然今天漲的快,但是它的 token cost 也很高,每個月要付幾百萬美金給到 Sonnet 和 GPT 模型。更強的商業模式是結果,本質還是是否能提供更大、更本質的價值。
各個垂直領域也比較重要,比如如何找到高質量、scalable 的資料,可能需要幾千上萬條高質量的任務,並對應 reward,這需要一些高水平的專家進行標註。
張小珺:這裡自動駕駛是不是一個擁有相對完整、比較好的 reward model 的領域?
Guangmi Li:是的。自動駕駛是個非常典型,端到端都比較好的模型。但它的 action space 非常小,僅僅透過前後左右來判斷安全。但語言和機器人的 action space 非常大, reward 就特別難定義。只要是在限定領域的 reward 都是比較容易定義清楚的。
張小珺:還有像自動駕駛這樣的限定領域中比較好定義的場景嗎?
Guangmi Li:量化、coding、數學。下一代模型也比較關鍵,無論是傳說中的 GPT-5 Orion,還是 Anthropic 的 Claude-3.5-Opus,或者 Gemini 的更大模型,他們的能力提升幅度有多大。我覺得不用悲觀,但也不要過度樂觀。肯定智慧會有提升,但是不會像以前從 80 提升至 120 這樣的陡峭。
張小珺:陡峭的時候智慧提升是快的?
Guangmi Li:o1 的天花板在哪裡?o1 做完了可能會有 o2、o3,大規模 scale o1 到 o2 到底會怎麼樣?有時候,模型訓練的收益來得快,但瓶頸有時來得也快。o1 可能是走向 AGI 的必經之路,但不知道是否會很快碰到天花板。如果 o1 這條路失敗了,達到 AGI 可能還要再耽誤幾年。
張小珺:你怎麼理解 o1 的天花板?
Guangmi Li:可以舉個例子,今天全球 70 億人,每天都在做任務,這 70 億人每天產生的新的知識增量資訊有多少?還是過去幾千年祖先積累的知識更多?如果把 70 億人持續探索和 inference 一整年的知識和資訊加起來,如果比過去老祖先積累的多,本質上就代表人類可以用算力換資料,這件事情很偉大。說明合成數據是成立的,但如果 70 億人忙碌一年沒有產生新知識,沒有任何增量資訊,不如祖先積累的多,那 o1 可能很快就到天花板了。
我個人是相信 70 億人一定可以產生更多的新知識的,只不過邊際可能沒那麼陡峭。
張小珺:還有什麼重要的問題?
Guangmi Li:還有兩個重要問題。
 第一,假設 coding 能力明年能提升 10-30 倍,軟體開發的正規化會有什麼改變?新的軟體生態會怎麼樣?未來的軟體會怎麼樣?
• 第二,context 非常重要,我覺得大家還不夠重視。
另外,還有很多科研問題值得探索,沒有解決的問題依然很多。比如,模型架構上進行什麼樣的改變,可以讓模型在後臺持續思考?比如今天的一個問題,人類可以思考一週再給出答案。人類今天學到一個知識,即時更新了大腦的記憶,但模型今天還沒辦法即時更新,這點也有提升空間。
張小珺:你認為在明、後年 C 端產品重要嗎?
Guangmi Li:我認為 C 端產品肯定也是重要的,比如誰能追上 ChatGPT 的規模?以 Chatbot 的形態主導的產品大機率不會成為下一個贏家了,需要有差異化的價值。核心指標可以看產品每週的活躍使用者量,下一個做到大幾千萬,甚至 1-2 個億的產品,可以拿到下一張船票。
張小珺:所以總結下來,未來兩年的關鍵因素有非常多方面?
Guangmi Li:使用者規模很重要,比產品形態重要很多。基礎模型可能還會突破,pre-train 可能還會有半代到一代的提升,但大家在技術模型的突破重點都放到了 post-training 上。
資料也非常重要,我很期待有產品形成資料飛輪,挖到大量高價值的資料或者在合成數據上有所突破。包括 AI 公司所謂的組織能力如何快速迭代。模型也重要,產品也重要,未來產品的粘性也需要提升。
今天, ChatGPT 的時長、粘性、頻次都不如 Google 和抖音,說明它承載的需求和可供挖掘的空間非常大。GPU 和人才也非常重要。真正懂 AI,並在一線幹活的人非常少,而人才是非常關鍵的。很多 Lab 都在說人手不夠,我覺得真正懂的幾十個人非常分散,還沒有特別集中。
張小珺:一年前你說大模型的秘密在三家公司:OpenAI,Anthropic 和 Google,現在怎麼看?
Guangmi Li:今天大的格局依然是這樣,只是人才確實有流動。之前,我們說做到 GPT-4 很難,但今天很多模型公司都做到了初代 GPT-4,但沒有做到 GPT-4o 和 Claude-3.5-Sonnet 的水平。過去兩年,模型能力的進步是非常陡峭的。兩年內,模型進步的陡峭程度可能比人類進化 100 年的智力提升還要高。
端到端、 full-stack 是比較重要的,但創業公司沒辦法做到那麼多。所以,創業公司就需要找到非常鋒利的點,做出一根針捅破天的產品。
張小珺:兩年內,你認為巨頭之間會有什麼大變化嗎?
Guangmi Li:不排除微軟投資 Anthropic。
張小珺:很多人說 scaling law 的魔法就要失靈了,你對 scaling law 持有什麼樣的觀點,能不能解讀一下最近 Ilya 發表的觀點:pre-train data wall?
Guangmi Li:現在有幾條 scaling law,Ilya 認為的 data wall 是預訓練的資料瓶頸。網際網路的資料是線性增長的,比如每月增加 1T 有效 token。但模型預訓練需要的資料是指數級增長的。我們上一期播客已經隱晦地提了這件事情,但 Ilya 今天公開說了。
預訓練今天看是 100% 遇到困難了,無論是 GPT-5,Claude-3.5-Opus,Gemini Ultra 等。預期不一定會非常高,但也不差。不確定這是永久性問題,還是短期問題。有些人很悲觀,有些人很樂觀。
今天的瓶頸一定不是計算或者架構問題,主要還是資料問題。網際網路上,能用來提升智商、用來大規模訓練的資料可能就 20-30T,每個月增加不到 1T 就到極限了。但有的人會樂觀地覺得現有資料的量化挖掘空間還很大,需要提高 data efficiency。比如,人類學習一個知識只需要 5-10 條樣本,但模型需要幾千、上萬條才能學會。25-26 年能不能讓模型學習效率提升。其次,整個網際網路上的資料佔到人類智慧的 5-10%,如何讓更多的人類智慧灌入模型中?這可能需要一個天才設計的互動系統。推薦演算法、推薦引擎已經把人的偏好資料沉澱在模型中了,但人的智慧如何更好地被沉澱在模型中?
OpenAI 遇到這個問題比較早,但是到今天也沒有完全放棄 pre-train,只是把 pre-train 和 post-train 重新整合了,現在叫 fundamental research。GPU 分佈也會有變化。之前,大家做 pre-train,pre-train 和實驗可能會佔到整個 GPU 分佈的 80-90%,未來可能 pre-train 和 post-train 佔到了 1:1 的關係。Tier-1 的公司都不能放棄 pre-train,因為這還會有提升,也是底座。
第二條 scaling law 是 o1 系列,分歧點在 o1 的天花板到底在哪裡,能不能通用、泛化。今天,語言模型到底是不是真正的泛化是不清楚的。很多問題都在訓練資料分佈內。如果 o1 不能泛化,只能在數學和程式碼裡面很強,會影響這輪 AGI 的天花板。OpenAI 基本 all-in 到 o1、o2 這條大的 bet,如果這條路失敗,OpenAI 會面對比較大的挑戰。賭贏了,天花板會開啟更多。
張小珺:我們之前聊的 o1 那期播客中你聊到後訓練有一個關鍵問題是獎勵模型 reward model,整個地球上也沒有一個 reward model 能衡量所有人,你相信未來會有嗎?
Guangmi Li:我覺得很難有一個絕對通用的 reward model 能夠衡量所有事。因為每個人、每個領域都很不一樣,甚至昨天、今天、明天都不一樣。最尖端的 researcher 可能也沒有想到泛化 reward model 的方法。不知道 Ilya 未來會不會有解。
可以確定的是,今天資料非常重要。大家花了很多精力標註資料,需要真實的高質量資料,現在每個人都會負責收集不同領域的資料,標註資料、請專家評估。在不同領域進行學習,大家依賴各個領域的資料拼湊提升模型。Reward model 通用泛化還是需要科學突破的。
張小珺:o1 的天花板會卡在哪裡?o1 的路線是共識嗎?它一定會走向 AGI 嗎?
Guangmi Li:真正的天花板可能會在資料和泛化。我覺得泛化可能是唯一關鍵的問題。回到剛才說的,是否要相信這個世界上會有一個統一、能評價所有人、所有職業的大一統 reward model?還是各個行業垂直構建的 reward model?如果是各個行業垂直的情況,那需要僱很多的人,設計任務、設計 reward,像老師出題一樣。這樣的速度就比較慢了。但從 o1 產品的角度來講,我觀察身邊人使用頻率並不高,它的產品形態今天也有瑕疵,比較慢,延遲比較高,使用門檻也比較高。實際上, 90% 甚至 99% 的使用者的 query 都用不到 o1。
o1 擅長解難題,但普通使用者用不到。它數理的準確度更高,數學和程式碼都很高。
張小珺:你認為 o1 的路線是共識嗎?它一定會走向 AGI 嗎?
Guangmi Li:這還是一個計算科學、實驗科學待發現的問題。只是今天還沒看到天花板,值得重點投入、嘗試。但至於最後走到哪裡,今天是有分歧的。有些人人覺得, o1 的天花板非常高,只要把 task reward 設計好,就能激發出 pre-train model 激發不出的能力。
也有一部分人認為 o1 可能很快遇到天花板,因為收益提升快,但遇到瓶頸也很快,不能完全靠模型 scale。o1 還是能讓人參與做 reward 的過程,過去兩年合作了一些專家參與標註,設計 reward,這是資料上比較重要的部分。即使 o1 走不下去,或者最終無法到達 AGI,沿途下站的成果也可能做出很好的產品,畢竟資源很多,人才也很多。
張小珺:所以 scaling law 聽起來可能演算法不是問題,算力也不是問題,遇到問題的是資料?
Guangmi Li:是的。大模型公司要考慮的還是如何更 scalable 採集高價值資料,未來形成有價值的資料飛輪。比如某天能夠出現天才的產品經理,將人類討論過程的資料記錄下來反饋給模型,是比較重要的,我們討論的過程有 Chain-of-thought 資料,這是模型記錄不了的,這是有價值的資料。包括如何用資料激發模型更大的能力,尤其是剛才提到的 data efficiency 如何提高。能力弱的人需要學很多條才能學會,能力強的人,可能兩條就學會了,這就是效率的問題。
張小珺:我開個腦洞,飛書這樣的產品形態可能是雛形嗎?它有大量的工作討論。
Guangmi Li:它的資料價值很高,Notion 這樣個人筆記軟體的資料價值也很高,資料資產的價值很高,但產品形態不好說。
張小珺:ChatGPT 的資料飛輪比較小?
Guangmi Li:ChatGPT 主要得到了偏好資料,而不是能力資料。它可以把你的偏好高效篩選,提升 MAU, 或者使用者時長,但對 AGI 沒有什麼幫助。搜尋、推薦也都是人類大規模投票的標註。如果 ChatGPT 把使用者偏好資料用太多,答案會趨向一致,喪失多樣性。
本來生成答案的可能有 1 萬種,但投票投多了就 200 種。ToC 使用者的資料是有價值的,但未來如何用好還要做很多研究。大多數的使用者資料沒有邏輯,但提升邏輯的方法很多,不一定需要使用者資料。
一件可能有意義的事是:使用者關心的需求是重要的,這會讓產品體驗更好,可以定向最佳化模型,最佳化資料。Google 有使用者的意圖資料,它可以基於此進行後端最佳化,這會更有意義。
張小珺:未來 ChatGPT 會有資料飛輪嗎?
Guangmi Li:存在一個理想的狀態:某個天才產品經理,設計了某個形態,把人類的思考的過程和高價值的資料都傳遞給模型,最有意思的就是你剛才提到的 FSD。推薦系統也是比較好的一個模型,甚至筆記軟體 Notion 的知識庫裡也可能是獲取資料、形成資料飛輪比較好的過程。
未來的形態可能一端是模型、一端是個人軟體,如何把個人軟體的資料 hack 出來,作為 context 自動放到模型裡幫助完成任務,這個過程非常有意思。我覺得今天讓人標註的方式都不夠本質、不夠 scalable。如果不考慮隱私的情況下有個 AI Bot 每天看你的微信,同步做其他事情,這是一個更自動化的過程。
張小珺:所以產品不是隻要人用就可以,還需要看如何在和人互動的過程中吸收人類的智力。
Guangmi Li:對。
張小珺:哪些產品裡還有高價值資料?
Guangmi Li:比如搜尋,首先使用者意圖資料很重要,但未來 AI 搜尋有持續性的研究話題,並能夠持續追問,這裡面可能有高價值資料和 CoT 資料。Notion 裡有高價值資料,那是使用者反覆想出來的知識,結論比較多。未來, AI 公司的 Artifacts 或 OpenAI 的 Canvas 可能也能有,因為做任務過程中產生的拖拽,可以記錄使用者思考的過程。
瀏覽器上的點選資料也很有價值,點選是有使用者行為和邏輯的。但 Google 不敢用這個 Chrome 的資料,因為可能有合規問題。作業系統的資料也非常重要,因為有使用者怎麼操作軟體的資料,未來 AI 是可以模仿使用者操作軟體的。
張小珺:Anthropic coding 能力比較好是因為在資料上做了特殊處理嗎?
Guangmi Li:還是預訓練的 code、data 做的比較認真。最後,關鍵點還是資料。好的 AI 公司都花了大量的時間在資料上,比如 OpenAI、Anthropic。但如何做好資料,大家是沒有共識的,tier 2 的公司其實都是沒做好資料的。
張小珺:按照我們之前跨年特輯的傳統,回顧一下你心目中能定義 2024 年全球大模型產業的關鍵時刻?
Guangmi Li:如果只說一個,我會說今年夏天 6 月 20 日 Anthropic Claude-3.5-Sonnet 模型釋出,因為這個模型真的讓大家進入生產力提升的階段,帶來 coding 程式設計能力的巨大進步,緊接著,才讓後面的 Cursor 和今天的 Devin 火爆。今天他們大部分的用量都來自於 Sonnet, Cursor 和 Devin 都要給 Sonnet 付幾百萬美金的 token 消耗費用。
張小珺:這是全球大模型狂卷的第二年,你覺得經過了這一年卷出了什麼?
Guangmi Li:coding 開始進入了大規模生產力提升的階段。25 年對 coding 更樂觀、確定性更高,代表下一代軟體生態的形成。
也卷出了 ChatGPT 這一 killer app,在 c 端一枝獨秀。今年 agent 的基礎設施落地慢慢臨近了。
張小珺:今天想要進入決賽圈,條件是什麼?
Guangmi Li:c 端使用者和開發者的投票。各家的產品有沒有真正被用起來,有沒有拿到使用者、開發者的投票,這是一個條件。如果你的東西沒人用,自己說的再厲害都沒用。
模型層, 擁有 10 萬張有效、已經使用的卡,這是全球第一梯隊的決賽標準,沒有這點是不行的。
張小珺:哪家公司的產品真正被用起來,和你去年說誰能先做到 GPT-4 ,他們的關係是什麼?
Guangmi Li:做到 GPT-4 代表一個智慧水平,只有到了這個標準使用者才會用、才會買單。但是大家今天都超過或者做到初代 GPT-4 了,前面還有能力更強的模型。這點已經沒有意義了,因此,還是需要有差異化的能力或智慧的體現。
張小珺:人工智慧是能力。
Guangmi Li:對。但我覺得在決賽圈沒有大腿好像是不行的。OpenAI、Anthropic、xAI 、Llama 都有大腿。
張小珺:你去年這個時候說, 2024 年是決定長期格局最關鍵的一年,格局形成後以後很難改變。今天來看你的說法對嗎?
Guangmi Li:過去一年挺清楚的,和我們上一年跨年預測的一致。模型第一梯隊可能就是 3 家或者 3+2 的發貨月:OpenAI、Anthropic、Google 屬於絕對的第一梯隊,xAI 和 Llama 緊隨其後,沒有額外的競爭對手了。模型格局很難改變了,誰還會今天加入第一梯隊?微軟、Amazon 都不容易,位元組有可能。
張小珺:哪些去年的判斷,你今天更堅信了?哪些去年的判斷,你今天認知有所變化?
Guangmi Li:對比開源模型和閉源模型的觀點會有些改變,因為有 Meta 的存在,Mera 的投入比我們想象的要更加強大,這點對比之前的判斷髮生了很大變化。也要看 Llama 4 會怎麼樣。去年跨年,我們判斷位元組很有優勢,今天更清晰了,豆包的 DAU 非常強大。如果位元組明年使用者增長很強,模型和產品一起迭代可能會比較好。
去年,我們提出了新的摩爾定律,這個預測還算準確,誤差非常小。我對成本降低更加堅信了,未來做 inference 推理的主力模型不一定是特別大、 100B 以上的模型,而是 3-8 B 的一檔位,或 30-50B 的這一檔位。這兩檔可能會做 inference 的主力,而不需要 100B 以上做主力的推理模型。
之前,我對底座模型和預訓練的預期更高。之前我們預測 25 年才會碰到資料問題,沒想到這麼早。先前覺得還能在此之前走好幾代,沒想到撞牆來的這麼快。其次,巨頭和大公司依然非常有優勢,無論是 Apple、Amazon、Google 和位元組,這些大公司還會很強。
張小珺:美股市值最大的 7 巨頭裡面,你最看好哪個?
Guangmi Li:股票角度,今天我比較喜歡 Amazon。第一,它和 Anthropic 的合作關係比微軟和 OpenAI 更健康, Anthropic 的模型某些地方比 GPT 更好,對 AWS 的拉動很明顯。如果認真看 AWS 財報,它的 AI 業務增速每年是 100%,在翻倍。因此,邊際增量的利潤是很高的,能接近 80%。大家都低估了 AWS 的盈利能力,這一能力未來還會很強。
還有一個關鍵點是自研晶片,這是比微軟和 OpenAI 領先的,相當於 AWS 這一大的雲廠商有了自己的 TPU,這一戰略落地對 AWS 的意義比較大。
張小珺:為什麼不是微軟?
Guangmi Li:微軟的產品一直做的不好。比如 Cursor、Devin 這種面向開發者群體的產品從微軟手上溜走, Copilot 也沒有達到大家預期。
張小珺:哪些公司有可能成為下一個萬億美金市值的公司?這裡不作投資建議。
Guangmi Li:SpaceX 和位元組的確定性非常高,OpenAI 也有潛質。
張小珺:你覺得 o1 能否短期做到通用泛化?
Guangmi Li:比較難。今天語言無法判斷是否真正泛化,也可能今天的語言是假泛化,真的泛化還需要突破。我比較期待 Ilya 如何解決這個問題。
張小珺:哪些行業會被改變得很快?
Guangmi Li:涉及到知識工作者的自動化都有機會被 agent 改變,可以把很多 workflow 都自動化。
張小珺:你對明年投資哪裡比較樂觀?
Guangmi Li:各個領域都會出來背景比較好的 agent 公司,類似 Devin 的架構。一批一批的 Devin 會出來。
張小珺:明年如果只投一個方向,你會投什麼?
Guangmi Li:圍繞 coding 相關、 agent 落地相結合的。解決剛才提到的長距離推理任務的 long-horizon task。
張小珺:AI 市場的泡沫大嗎?
Guangmi Li:大產業總是預期走在營收前面,有泡沫對產業是好事。但長期變成偉大公司的前提是要跑出好的商業模式,把泡沫填上。
張小珺:矽谷人才正在流向哪些公司?
Guangmi Li:Anthropic、OpenAI CTO Mira 和 post-training lead Barrett 的新公司、Cursor、Devin,這幾個是比較好的。
張小珺:你有什麼比較喜歡的產品公司?這些公司在 AI 時代能發揮更大價值?
Guangmi Li:Notion 很好,因為佔住了個人的知識資料,資料資產的價值很大。微信的資料資產價值也很大,但微信可能不好用,因為涉及到隱私的問題。
張小珺:總結一下這一輪最大的機會在哪裡?
Guangmi Li:這一輪最大的機會有三個:第一是我們一直聊的下一個 Google,融合了搜尋、推薦、問答、coding、做任務。它可以更加的主動和被動,體現在資訊分發、超級助理,這是最大的機會,確定性最高,是明牌,大家都在做。
第二是下一個 Meta,核心是互動性,大家賭的是形成一個新的內容消費平臺,是從影片生成或者其他的方面。但我們今天高估了生成環節的重要性,其他環節也很重要。
第三是我們低估了 AI for Science,科學發現。全球最強的兩個 Lab 的 CEO 都很看好,一個是 Anthropic 的 CEO Dario,看另一個是 DeepMind 的 CEO Demis。Demis 個人專注在一個製藥的公司,可以從他的 Twitter 簽名看到。矽谷這邊已經有不少 AI for Science 的苗頭了,專注於 AI 材料設計的團隊也會更多。
張小珺:下一個 Google 指的是新的任務分發工具,下一個 Meta 指的是社交嗎?
Guangmi Li:這是一個新的內容消費和娛樂平臺。可能會像是 Tik Tok。當然如果有新的社交也可以,但我不知道新的社交要素是什麼。
張小珺:能不能總結一下 24 年的幾個關鍵詞?
Guangmi Li: Coding、Coding、Coding.
張小珺:預測一下 25 年的關鍵詞?
Guangmi Li:  Agent、Agent、Agent.
張小珺:我們聊全球大模型季報一年了,AI 真實的改變了你的工作流了嗎?
Guangmi Li:還是改變了很多,尋找資訊和處理資訊的效率提高了非常多。我自己經常換著用 Claude,ChatGPT 和 Perplexity 這三個產品。
排版:Doro
延伸閱讀

Metronome:OpenAI、Anthropic背後的計費平臺,會是AI時代的Stripe嗎?

估值13億美金,Clay 用 AI Agent 幫企業找客戶

Bolt.new:AI Coding 領域的 Figma,2 個月實現近千萬美元 ARR

Abridge:AI Scribe 成為 AI 醫療應用的最佳實踐

AI Coding 最全圖譜:Agent 將如何顛覆軟體

相關文章