用聲音,聽見真格。
「此話當真」是一檔泛商業類播客,我們希望搭建這樣一個分享和交流的平臺,讓每一個對商業、科技、創投充滿好奇的人都能在這裡有所收穫。每期播客將會由不同的真格投資人擔任主持,和各領域的領軍人物一起帶大家深入瞭解科技趨勢,以及創新技術的影響力。交流科技熱點,我們只想給你最專業的解讀。
當然,我們希望這不僅僅是一個播客,更是一次創業的探索。真格,你的創業第一站!我們期待與你相遇,一同發現新的可能。
回顧 2024 年,AI Coding 無疑是過去一年裡最炙手可熱的領域之一,Cursor、Poolside、Cognition、Magic、Codeium、Replit 等多家獨角獸的出現,都在反覆驗證著這一市場需求。
從更長遠的時間尺度來看,Agent 是 AI 落地人們日常生活的最小可能單位。在過去不到兩個月的時間裡,Coding Agent 已經完成在產品形態上的二連跳,從能夠上下文預測的 IDE 程式設計助手 Cursor,到實現支援多輪對話的 Replit,使用者得到的「交付物」已不只是基於搜尋關鍵詞的網頁,而是根據自身需求生成的軟體。12 月 11 日,Cognition AI 正式對公上線「AI 程式設計師」Devin,不僅能為使用者提供建議、自動執行指令任務,更能獨立完成對整個軟體專案的開發,再次打開了世人對 Coding Agent 全新的想象空間。
12 月 21 日,在 OpenAI 連續 12 天釋出會的最後一天,o3 模型重磅登場。在由真實世界軟體任務組成的 SWE-Bench Verified 基準測試中,o3 模型獲得了 71.7% 的準確率,比 o1 模型高出 20% 以上;在評估 AI 類人推理能力的 ARC-AGI 測試中,則取得了 87.5% 的分數,首次突破人類水平閾值(85%)。OpenAI 執行長山姆·奧特曼在釋出會上表示,「我們認為這是AI下一階段的開始。o3 能夠完成許多複雜且需要深度推理的任務,尤其在程式設計和數學領域表現令人難以置信。」
展望 2025 年,AI 領域還有更多值得思考的問題。底層大模型突破後,AI Agent 還會以怎樣的形態出現?Coding Agent 產品的核心能力與技術壁壘在哪裡?未來的組織里又需要怎樣的新員工?下一代的「網際網路」會以怎樣的形式到來?在面向未來的開放式想象中,Coding Agent 和以 RL(強化學習)為新正規化的 o3 系列,都會是所有討論裡無可迴避的焦點。
眼下,陳舊的想象已然無法滿足技術的野心。或許能夠實現 end-to-end 的 Coding Agent,能做成的事情已遠不止 Coding 本身。以改變人們的工作方式為起點,Agent 是人們邁向 AGI 的最小單位,而每次迭代帶來的全新正規化,都在反覆提醒人們這樣一個事實 —— 未來,正在加速到來。

內容綱要
-
為什麼說 Devin 展示了「工作」的 scaling law?
-
最早引領 Coding Agent 潮流的 Replit Agent,以及開源 Devin 專案 – Openhands, 在設計中有哪些關鍵決策?
-
Coding 領域未來是 Devin 形態贏家通吃嗎?
-
底層模型能力之外,Coding Agent 應用公司的核心能力和壁壘是什麼?
-
Coding Agent 對未來的社會組織和工作形態,會有哪些深遠影響?
-
如何看待 o3 超越大部分人類的能力?未來的發展空間在哪裡?


未來,正在加速到來。

主持人
謝巖 Monica:真格基金投資副總裁
聯合主持人 Peak:真格基金 EIR
嘉賓
戴雨森:真格基金管理合夥人,聚美優品聯合創始人
李珎:Replit Agent 核心成員,Replit 資深工程師
王星堯:Allhands Al (FIFIE OpenHands) 聯合創始人,首席人工智慧官,UIUC PhD
惠彬原:阿里巴巴通義實驗室科學家
時間軸
Coding Agent 的發展演進
01:56 嘉賓自我介紹與最近體驗到有意思的專案
13:36 Coding Agent 的四個代際與三次進化
16:53 Devin 引發的全新想象:工作的 Scaling Law
兩家 Coding Agent 公司的創業故事
20:47 Replit Agent的創業歷程及關鍵節點
25:50 「優秀創業者的產能會被無限放大。」
35:59 幾次技術更新:Integration、Edit 和 UI
38:06 未來不同 Coding Agent 產品形態會複合嗎?
37:30 OpenHands 不同尋常的誕生
47:48 「要用有限的空間,做無限的事情。」
52:25 開源:用 Coding 推動一種技術民主化
1:02:40 Coding 產品的長期競爭力是什麼?
o3 釋出:突破、侷限與趨勢
01:07:20 AGI 的未來已經近在眼前
01:18:10 解決真實世界的複雜問題,o3 還需做什麼?
01:22:23SWE-bench 被「刷爆」,下一個 Benchmark 是什麼?
未來,如何做好一個 Coding Agent?
01:34:27 Coding Agent 重要時點回顧
01:39:23 未來的組織形態,理想工程師的畫像是?
01:56:11 如何提高模型多步驟任務的能力?
02:05:54 Agent 普及後,底層技術棧的新機會
02:11:30投資人視角下的創業機遇
02:23:27快問快答
相關推薦
Cursor:https://www.cursor.com/
Cognition labs/Devin:https://app.devin.ai/
Replit:https://replit.com/
Replit Agent:https://docs.replit.com/replitai/agent/
OpenHands:
-
官網:http://github.com/
-
論文: http://arxiv.org/
VisualWebArena: http://arxiv.org/
TheAgentCompany:
-
官網 http://the-agent-company.com/
-
論文 http://arxiv.org/
Computer use by Anthropic:https://www.anthropic.com/news/3-5-models-and-computer-use/
你可以透過小宇宙、蘋果 Podcast 、喜馬拉雅收聽我們。如果你對節目有任何的建議與期待,歡迎在留言區互動~
如果你有任何的創業想法或合作想法,歡迎發郵件到 [email protected] !

推薦閱讀

