AIcoding的雄心、困局與終局|峰瑞研究所

這個5月，AI coding（AI 程式設計）領域發生了不少標誌性事件。

5月3日，蘋果與初創公司Anthropic聯手開發由AI驅動的Vibe Coding（氛圍程式設計）平臺；三天後，OpenAI被曝將以30億美元收購AI程式設計新銳Windsurf；5月17日，OpenAI又推出集成於ChatGPT的Codex智慧體，實現自動生成、除錯和最佳化程式碼；美團在5月20日宣佈將上線一款AI程式設計類工具“NoCode”，則為這場競賽注入 “中國變數”。

可以說，在全球範圍內，AI coding工具正爆發式湧現。從GitHub Copilot，到火爆出圈的Cursor、Devin，再到國內位元組推出的Trae、阿里釋出的通義靈碼，在大模型的助推下，AI coding正在從單純的程式碼補全向更為智慧化、一站式的方向演進。未來，AI coding能否實現執行完整程式設計任務的雄心？AI coding將沿著何種路徑演進，最終又將去向何方？

在「What's Next｜科技早知道」的播客節目中，峰瑞資本投資合夥人陳石和「聲動活潑」聯合創始人&「科技早知道」主播丁教Diane，以及「科技早知道」節目監製雅嫻，圍繞AI coding的演進路徑與未來趨勢，探討了以下問題，包括但不限於：

在大模型助推下，AI coding將沿著怎樣的路線發展？
AI coding的核心壁壘在何處？“得上下文者得天下”成立嗎？
為什麼說在AI coding領域，要找到“非共識”的方向？
“小白程式設計”是個偽命題嗎？AI coding的使用者畫像是什麼樣？
在中美的創業生態環境中，初創公司和大廠分別會聚焦哪些AI coding賽道？
AI coding這塊蛋糕最終會被怎麼分？這次熱潮會改變晶片市場嗎？

我們擷取編輯了播客的部分內容，希望能帶來新的思考角度，歡迎跟我們一起持續觀察和探討。也歡迎移步小宇宙APP 或 Apple podcast，搜尋並訂閱「What's Next｜科技早知道」收聽完整版。

期待與大家持續交流，如果你也關注晶片行業，或者在創業，歡迎聯絡峰瑞資本合夥人陳石（[email protected]）

互動福利

在AI coding領域，你看到了哪些創新機會？歡迎你在評論區和我們聊聊你的看法。截止至2025年5月28日17:00，留言最走心的3位讀者將獲得尤瓦爾·赫拉利撰寫的《智人之上：從石器時代到AI時代的資訊網路簡史》一書。

/ 01 /

Copilot or Agent

AI coding的兩條進化路線

雅嫻：AI coding發展了很長時間，但最近兩年才火出圈。AI coding的演進路徑是什麼？現在有哪些比較典型的產品形態？

陳石：在程式設計過程中，人們會用到一個思路叫“結對程式設計”。兩個程式設計師在一臺電腦上寫程式，一個人是“駕駛員”，直接敲程式碼、專注於實現細節；另一個是“導航員”，觀察程式碼、思考整體方向，發現問題、提出建議。

AI coding真正起源於2021年。

此前，有一些像程式碼補全工具Tabnine這樣的公司，嘗試用機器學習的方法做AI coding。但那時大模型還沒有發展起來，AI coding類產品也很難做好。

2021年，微軟旗下的GitHub和OpenAI合作開發了GitHub Copilot這款程式設計產品，AI coding才真正有了比較成型的產品。GitHub Copilot的定位是結對程式設計的駕駛員，也就是是具體寫程式的人，人類則作為導航員。GitHub Copilot早期主要功能是程式碼補全，藉助GitHub的程式碼庫和GPT-3模型，GitHub Copilot能力有所提升。

2022年年底，GPT-3.5釋出之後，AI coding才有了實質性進展。進展可以分成兩條線：

一條線是Copilot助手，就是人主導、AI輔助，包括Github Copilot、Cursor、Windsurf、Trae這類產品已經進入到實用階段。尤其是Github Copilot，使用者規模已經突破1500萬，在2024財年為GitHub貢獻超過40%的收入增長。

另一條線是Agent智慧體，就是AI主動執行、人類監督。其實人們研發智慧體的初衷是希望它能夠獨立完成一個完整的程式設計任務，但目前還沒有完全實現，也還沒有找到PMF（Product Market Fit，產品和市場達到最佳的契合點）。

比如Devin這款程式設計產品，它希望成為全自主的AI軟體工程師。我們也觀察到有公司在做垂類的Agent，例如：單元測試（對軟體中的最小可測試單元，通常是一個函式或者方法進行驗證的過程）或程式碼Review（程式碼評審，確保程式碼的質量、發現潛在的錯誤）等。

雅嫻：按我的理解，Copilot更像是一個工具，Agent更像是一個人，可以從頭到尾理解你的意思，給你交付出一個結果，中間不需要太多人為干涉。

陳石：其實研發Agent難度非常大，想要研發好，一方面模型的能力要足夠好，特別是能理解的上下文要足夠長。目前，Cursor提供的AI模型的上下文長度，或者說“腦容量”只有20萬token。我覺得20萬token或者100萬token是遠遠不夠的。

另外，Agent對於人類的上下文收集能力也要足夠強，要收集、瞭解使用者個人的上下文，或者企業的上下文，否則很難理解背後的需求。比如，“研發一款短影片軟體”這個需求是非常複雜的，人們很難表達清楚。

Agent目前面臨模型能力、上下文收集能力兩方面制約，Copilot這種協作類產品比較容易率先開啟市場。

雅嫻：剛才你提到了Devin這個產品。Devin在剛釋出時引起了蠻大轟動，現在融到了很多錢，但是為什麼還是一個不能太落地的產品呢？

陳石：Devin的定位是全能一站式寫完一個複雜軟體。“複雜”最直接的體現是軟體的程式碼量。

以Google的Chrome瀏覽器為例，它大概有數百萬行程式碼，而一行程式碼可能有5-10個token。一般的AI模型顯然裝不下這麼多token。

▲ GPT所梳理的大型軟體程式碼量。

不止Chrome，據說像Facebook和Netflix這種分散式系統或者是應用，甚至有上億行的程式碼。如果AI coding產品不具備強大的“腦容量”，很難去理解一個系統或者應用的全域性架構，更談不上系統設計。

所以，AI coding不是寫幾行程式碼那麼簡單。做一個類比，設計編寫一個複雜軟體，首先你需要讀完很多文件或程式碼等資料，相當於把一整座圖書館裡的書都看一遍，才能讀懂每本書及書與書之間的內容和邏輯關係。學完這麼大體量的內容，你才可以比較好地做複雜軟體的AI coding。

所以我覺得Devin的定位挺不錯的，也有雄心，但是它目前似乎只能做到中間階段，可以寫部分簡單或者中等規模的程式碼，但可能還寫不出複雜程式碼，或者說寫複雜程式碼還是需要人類來幫忙。

▲ AI coding產品全景圖。

雅嫻：我們看到一張圖，它總結了主要的AI coding產品。縱軸上的L1到L5代表產品自動化的程度，數值越大，自動化程度越高。Devin的理想可能是做到L4，成為AI engineer（工程師），不是task base（任務導向），也不是project base（專案導向），是一個更高層的自主化階段。

陳石：其實現在AI coding產品還不成熟，能執行一些task層面的簡單任務就已經很不錯了，談不上project。在Copilot以及一些垂類需求的Agent上，可能還有機會變得更成熟，比較實用，市場能夠接受。

/ 02 /

得上下文者得天下？

丁教：可能現在程式設計師最穩健最安全的做法還是用Copilot，讓AI幫忙補全程式碼。這也是大家付費意願最強的一塊，對嗎？

陳石：對的，程式設計師這個群體相對來說需求比較確定，收入比較高，或者對企業而言成本比較高。如果能夠提高效率，無論是企業或者個人是願意出錢的。

很多人會問：AI大模型時代，如果絕大多數的能力集中在基座模型側的話，那麼做AI應用的價值到底在哪裡？畢竟大模型可能捎帶手就把應用給做了。這個問題是行業裡大家都特別糾結的，直到2024年下半年，我才想通了這個問題。（歡迎閱讀《展望2025，AI行業有哪些創新機會？ | 峰瑞報告》）

我覺得未來AI行業的價值、壁壘或技術積累會集中在“雲”、“端”兩側。

雲這一側是大模型或者雲服務，基本上AI應用的智力、創造力、規劃這些能力都是從大模型過來的。

端側今天的需求很明確，就是要拿下使用者的上下文。在個人使用者側，上下文可能是使用者的一些習慣和背景，或者使用各種產品、各類應用的一些選擇和偏好等等。在企業側，上下文可能指企業的程式碼庫、內部資料、知識庫或文件，以及行業領域的知識等等。

還有更進一步的，我們叫新的上下文。比如用Cursor做任務的時候，本質上是使用者自己做資料標註，這類標註如果被Cursor、Trae這樣公司收集起來，是非常有用的。

不僅如此，今天有一些所謂MCP（Model Context Protocol，模型上下文協議）或者Agent to Agent的協議（由Google推出的開源協議，旨在實現Agent智慧體應用程式之間的通訊和互操作性），能夠讓使用者在客戶端可以呼叫任何其他應用的服務。例如，以後說不定我們可以在Cursor或者Trae上定美團外賣。這樣的話，使用者的上下文在各個應用場景都可以被收集上來。

我覺得未來在AI應用領域，很可能就是得上下文者得天下。

為什麼像OpenAI這樣的大模型公司願意自己做客戶端？就是要直達使用者。網際網路上的資料都被拿來做AI模型的預訓練或各種後訓練，用得差不多了，但是有一類資料還沒有被充分收集起來，就是使用者的上下文，這才是人類需求的源泉。如果你收集到足夠多、足夠準確的上下文，意味著拿到了能產生更好訓練效果的資料。

/ 03 /

“小白寫程式碼”，是個偽命題嗎？

雅嫻：在我看來，AI coding產品中，Cursor更像是ToC的生意，Windsurf像是ToB的生意。那麼在AI coding這個領域，業界對ToC還是ToB有什麼樣的共識？

陳石：當前最先“成熟”的是ToP（To Professional），即面向專業人士。ToC的話，小白用這些AI工具還是蠻難的。

比如ChatGPT，可能專業人士更願意為其付費。對於普通使用者而言，大模型應用有一定的學習門檻，不一定能夠適應。

對於AI coding產品來說，面向專業使用者是挺好的路徑。專業使用者可能有兩類，一類是專業的開發人員，本來就從事開發，用這種AI coding工具比較順手。還有一類是非程式設計師背景的專業人員，比如產品經理、資料工程師，或者像我這樣之前寫程式碼但現在不寫的人，這類人有潛質能夠指導AI寫出好的程式。這兩類人可能願意為AI coding產品付費。

現在全球有數千萬程式設計師，如果加上非程式背景的專業人員，估計有幾億人。

雅嫻：“小白有寫程式碼的需求”，這會是個偽命題嗎？

陳石：我覺得不太成立。大部分小白使用者可能並不需要程式設計，他們可能需要更好用的office軟體。

現在大模型內建了一些升級版office的功能，比如OpenAI的Canvas（協助寫作和程式設計）、Claude的Artifacts（協助程式設計和內容生成）。未來，可能會出現新的office應用，能用自然語言能執行一些類似程式設計的小任務，但它本質上是office。

/ 04 /

Vibe Coding會變成新趨勢嗎？

丁教：Vibe Coding最近好火，但似乎是給AI coding換了一個新的名字，其實還是程式設計師怎麼用AI來coding。

雅嫻：Vibe Coding是AI專家、前OpenAI聯合創始人Andrej Karpathy提出一種新的程式設計正規化，指的就是不用像傳統程式設計師一樣一行一行敲程式碼，而是用自然語言描述，讓大語言模型來生成程式碼。如果Vibe Coding能實現從程式語言向自然語言這種正規化轉移，意味著程式設計師不需要再去看程式碼的細節，只做一些指導或者評論反饋，就能實現程式設計的需求。

陳石：我以前寫程式，寫過的最底層的程式就是組合語言，對應的主要是機器碼，就叫低階語言，後來開始寫C語言這類中級語言，最後才是Python、Java、JavaScript這些高階語言。程式語言會進步，會越來越抽象，讓程式設計師失去對“底層”的控制。

但這種“失控”不見得是壞事情。如果今天大家都用匯編語言，我估計不會有這麼多好用的軟體出現。當編譯器這類工具能夠非常準確地把中高階語言對映到低階語言的時候，人就自然應該往高階、往抽象的方向去走。

Andrej Karpathy曾提出：“最熱門的新程式語言是英語。”此處的“英語”可以理解為自然語言。

▲ 圖片來源：社交平臺X。

2025年2月，Andrej Karpathy又提出Vibe Coding（氛圍編碼）的概念。意思就是用自然語言跟模型對話，讓它去編寫和修改程式，在這個過程中模型幾乎“忘記“了程式碼。

當然，Vibe coding現在還有各種各樣的問題。以我自己的親身使用體驗為例，我曾經在一款Vibe coding產品上用自然語言要求AI寫程式。但是這個程式一直無法編譯透過，AI判斷是一個框架的版本有問題需要升級，但是它改了半天也改不出來。後來，我就明確要求它更換成一個別的框架，馬上就好了。

作為一名“老程式設計師”，我大概知道問題出在哪；但是如果換成一位“程式小白”，如果你不給AI指條明路，它還在原有的框架裡頭繞來繞去，恐怕很難獲得良好體驗。

但是我覺得Vibe Coding未來是可以實現的。

和Python、JavaScript等程式語言相比，自然語言更抽象，但可能不一定那麼準確，容易存在理解上的歧義。但也正是因為自然語言更抽象，所以表達效率很高。如果將自然語言和程式設計工具或者數學公式等結合起來，說不定“程式小白”也可以做出較為複雜的應用。

丁教：Vibe Coding過幾年更加成熟，發展成用完全的自然語言來程式設計嗎？

陳石：往後看大概五年，有可能用Vibe Coding做出中小規模的軟體應用，因為今天的模型發展很快。但如果要做特別大型的軟體應用，可能比較理想的方式是，留一個人類幫助的介面，讓一位老程式設計師看著，人指導它的同時，也在標註，能讓這個模型會學得更好，Vibe Coding也會慢慢進步。

/ 05 /

中美的生態不同，初創公司和大廠

如何選擇賽道和機會？

雅嫻：初創公司和大廠做AI coding這件事情我還蠻好奇的。美國很多出圈的coding公司，比如Devin、Cursor都是初創公司。國內其實也有一些產品，像位元組的Trae、阿里的通義靈碼，初步看起來好像是大廠反應更快一點。怎麼看初創公司和大廠在AI coding賽道上的發展？

陳石：我在大廠待了五年，大廠如果立項做一個事情，往往上會傾向於選擇“看得見”的、或者最好是PMF得到了初步驗證的。選擇有共識的賽道，這對大廠來說是個好的選擇，它們沒必要把每一個末端的新東西都嘗試一遍。

大廠讓位，交給創業公司嘗試也好，後續可以收購，或者繼續做進來。這是很正常的，反倒給小公司留下了一些機會。

小公司有幾個特點。第一，創新速度比較快，人少、更敏捷，而且非常重要的是，它願意嘗試一些激進的、非共識的想法。第二是技術密度高，雖說人比較少，但是人才密度很高，工作起來很高效，沒有大公司的那些流程。另外，小公司可以充分利用開源的外部生態支援。

AI coding這個市場非常大，大家都處在早期，還看不到終局。所以，大廠和創業公司基本上還在一個起跑線，這裡有很多機會。

但歸根結底，創業公司應該尋找“非共識”的創業機會。Cursor和Devin都屬於瞄準“非共識”的典型案例。

在Cursor出現之前，GitHub Copilot是以VS code（微軟推出的開原始碼編輯器，可以理解為程式設計領域的“Word”）的外掛形式出現，而Cursor在起步時就提出要做一個完整的程式碼編輯器。

這就是一個非常非共識的做法，對於創業公司來說，嘗試對一個程式碼量超過50萬行的程式碼編譯器進行大量修改，其工作量和技術風險都非常大。但只要做好，就可以控制程式碼編輯環境，從而有機會做出顯著超越Github Coiplot的產品功能。

如今，Cursor的上下文收集和打包能力很強大。遇到程式碼出錯的情況，Cursor會自動把程式碼、環境設定、報錯等上下文打包發給大模型，不需要使用者自己手動複製，極大提升了工作效率。

Devin的“非共識”在於定位。Devin定位是“全自主的AI軟體工程師”，曾被評價為“瞄得太高”。但高定位也是保護傘，在沒有太多確定性的時候，大廠可能不願意追。

雅嫻：那Devin會是AI coding的一種最終形態嗎？

陳石：Devin可能是瞄著終極形態去的，但是能不能做到、或者怎麼做到，以及是不是它做到，都很難說。起碼它的定位很獨特，可以一直往這個方向去發展。如果模型或者其他條件具備，說不定Devin就能做出來。這就是小公司的好處，大公司很難這麼幹，技術路線或者產品分支對不對都不知道的時候，大公司可能會觀望。

雅嫻：現在美國的大廠好像沒有中國的大廠步伐那麼快。

陳石：美國大廠跟隨的速度比較慢，反而給創業公司留了機會，創業公司有機會實現原創性的、定位上的突破。

峰瑞已投企業有一些做AI應用的，我會鼓勵他們出海，先去試一下，說不定有更多的機會，後續再“出口轉內銷”。

在不久的將來，在AI領域，中國未來會進化到實現獨特的創造，就跟中國的移動網際網路時代一樣。可能剛開始我們要向美國學習，後來我們做出了更好的產品和商業模式，反倒可以向美國出口。中國的團隊在ToC方向的產品能力很強。

在移動網際網路時代，無論從應用數量還是使用者規模，中國都超過美國；美國上一個火遍全球的ToC的應用應該是Instagram，已經是10餘年之前的產品了。

在AI時代，中國大量AI應用出海，也證明了中國企業的能力是在的，當環境具備的時候，他們可以再回來創造出新的物種。

/ 06 /

AI Coding會走向怎樣的終局？

丁教：如果從投資的角度來看，AI coding是比較火熱的賽道。因為它可能是AI領域PMF跑在最前面的，也是商業化最好的一個賽道。不管是在中國還是美國，現在這個機會視窗，是不是已經慢慢開始關上了？感覺頭部玩家已經慢慢形成了。

陳石：Copilot在中國的局面現在已經比較清楚，是被大廠瞄準的賽道。

我們鼓勵創業公司要做一些艱難的選擇，找一些非共識的方向。比如嘗試預判下一代模型會具備什麼能力，在此基礎上，你去思考把它落地到哪些場景。還有一類就是深入做一些垂類的應用，比如生物領域。這些都是挺好的機會。

就Coding而言，我建議創業公司嘗試Agent，因為Agent的技術路線更難。反正大家都一個起跑線，不妨賭一把。

雅嫻：以後，AI coding這個蛋糕是會被不同的玩家來分，還是說可能最後會是贏者通吃的狀態呢？

陳石：AI coding仍處於各方面都在變化的狀態，互動、載體，模型以及上下文能做到什麼程度，都是一個問號。

未來用AI寫軟體涉及到很多複雜的因素，比如，模型的上下文長度要足夠長，還要讓人類在前端心甘情願地做標註。此外，用程式碼寫軟體還是用“神經網路”寫軟體，是兩個完全不一樣的事，而使用者的需求應該用哪種方法來實現，也是不確定的。

從歷史發展的角度來看，Coding是對人類社會起到重要作用的一種開發工具。從計算機出現至今，Coding的載體、物件、使用者都在變化。未來，Coding還會有各種可能性，當下我們很難預判它的終局。

雅嫻：終局不容易預判，但機會還是有的。

陳石：對，大家都看不見，創業公司也可以“渾水摸魚”。

雅嫻：今天咱們聊完，我有一個體會。打個比方，如果把AI Coding的終局想成一個特別高的臺階，我們現在還沒辦法一步邁上去。但是我們可以搭很多小一點的、淺一點的臺階，一步一步邁上去。

陳石：投資圈有個說法叫“沿途下蛋”，意思是有一類專案，在達到它的設計終點目標之前，可以沿途輸出階段性的產品或服務，從而形成一定的技術驗證和商業收入等成果，且有利於未來目標的達成。

以Devin為例，讓它直接完成一個複雜需求，可能會在不同環節報錯。可以考慮引入人類的協助和提示，將需求拆分為階段性的內容，沿途下蛋、一步步完成。這也是一個讓Devin迭代進化的過程。

如果程式設計的產品設計有類似的演進過程，沿途下些蛋，不僅可以養活自己、鍛鍊團隊，還可以積累一些經驗，然後慢慢地走向終局。

互動福利

▲從美日IP產業的百年變遷，看中國IP經濟的發展趨勢 | 峰瑞報告

▲展望2025，AI行業有哪些創新機會？ | 峰瑞報告

▲一文講透關於DeepSeek的7個核心問題 | 峰瑞報告

▲DeepSeek開了第一槍，但更值得期待的是AI普惠 | 對話行雲積體電路季宇

星標峰瑞資本微信公眾號

一手商業思考及時送達

dignews.cc

AIcoding的雄心、困局與終局|峰瑞研究所

相關文章

Coding-Agent進化論：三小時深度對話中美Agent創業者、阿里研究員和投資人｜此話當真EP34

GruAI張海龍：產品形態只是表象，Cursor與Devin終有一戰｜AI產品十人談

【萬字訪談實錄】DeepSeekR1釋出前夜，3小時矽谷連線，深度解讀CodingAgent&OpenAIo3

LLM競賽2025：超越Google之路

從R1到Sonnet3.7，ReasoningModel首輪競賽中有哪些關鍵訊號？

【OnBoard！三萬字實錄】對話OpenAI，Replit，Augment核心成員：深度解讀Agent底層能力與互動設計

Codeium：企業原生AICoding產品，能開創AgenticIDE新正規化嗎？

為什麼Manus底層模型沒用DeepSeek？——Manus六問六答

JetBrains推出AI編碼智慧體Junie，但使用者評價不高

與Koji的2025開年對談：AI關鍵之年，Agent開啟元年｜此話當真EP35