
作者:王子、顧程來、Evan、李海丹
編輯:李海丹
封面來源:美劇《矽谷》
#01
開篇
生成式AI,作為當今最具顛覆性的技術之一,正在引領各行業進入全新的發展階段。
2025年伊始,圍繞生成式人工智慧的競賽愈發激烈。美國總統特朗普上任第二天,白宮宣佈啟動名為“星際之門”(Stargate)的人工智慧專案,由美國甲骨文公司、OpenAI與日本軟銀集團聯合出資打造。
1月14日,OpenAI推出了名為Tasks的測試版功能,標誌著ChatGPT正式邁入AI智慧體(AI Agent)階段。春節期間,中國大模型DeepSeek憑藉其推理模型DeepSeek-R1引起了廣泛關注,該模型以OpenAI十分之一的成本達到了GPT-o1的同級別表現。同時,DeepSeek在1月26日登頂蘋果App Store和谷歌Play Store全球下載榜首,上線18天內下載量突破1600萬。
緊接著,OpenAI繼續推動創新,釋出動作不斷:1月24日釋出了一款代號為“Operator”的全新AI Agent產品;隨後2月1日推出o3-mini,專注於STEM領域,支援函式呼叫、流式傳輸、結構化輸出和搜尋結合等功能;2月3日又推出面向深度研究領域的智慧體產品,進一步拓展了其在專業領域的應用。谷歌也不甘示弱,在2月6日凌晨釋出了效能更強的Gemini 2.0系列模型,包括Pro、Flash和Flash-Lite三個版本。
如今,生成式AI正迎來類似的歷史時刻,這不僅是科技革命,更是商業重塑的契機,我們正站在這一變革的起點。每一次平臺級機會的背後,都會催生出一批市值百億、千億美金的公司。從網際網路到移動網際網路,再到雲計算和區塊鏈,每一次基礎設施的創新都激發了無數新的應用場景,推動科技巨頭的崛起。
回顧這些歷史週期,我們發現,基礎設施的完善往往會催生應用公司的黃金髮展期。生成式AI作為新型基礎設施,正處於這一發展軌道的起點。未來,這些公司將透過創新的商業模式和智慧化產品,重新定義我們的工作和生活方式,迎來屬於自己的千億市值時代。展望2025年,大語言模型將會走向何方?在這份報告中,我們將從行業變化、技術進展和應用趨勢三方面,對大模型的未來發展進行深入前瞻。
#02
AI瘋狂吸金,千億獨角獸冉冉升起
2024年,最為人們印象深刻的,便是生成式AI公司——OpenAI高達65億美元的融資。這筆融資讓這位生成式AI的弄潮兒估值達到約1500億美元——一隻大型千億獨角獸正在矽谷茁壯成長,而這只是2024年中最具代表性的一個。生成式AI所創造出的“造富神話”,多次讓人們情緒高漲,AI就像一個龐大的“吸金獸”,以颶風般的速度吸走了大部分的風投資金。
湧入AI賽道的大量資金和頂尖創業者,正在催生出了一批新晉獨角獸公司。根據矽兔君覆盤,在過去18個月新增的73家獨角獸中,有28家是AI公司,佔到了新增獨角獸的大約三分之一。例如特斯拉創始人埃隆·馬斯克在2023年7月創立的xAI,2024年3月釋出了首款AI聊天機器人Grok-1,隨後釋出了Grok-1.5V大模型,其在最新一輪融資中,估值達到240億美元;Xaira Therapeutics,作為AI+生物技術領域的公司,其聯合創始人David Baker在“AI+蛋白質”領域頗有造詣,其團隊研發出AI大模型RFdiffusion,用擴散模型構建的創新型生成式AI系統,並且可以按需構建AI分子,估值為27億美元;Cognition AI是一家由三位華人創業者創立的公司,2024年3月,其推出了世界上第一位完全自主的AI軟體工程師,在最新一輪融資後估值達到20億美元。

製圖:矽兔賽跑,資料來源pitchbook

製圖:矽兔賽跑,資料來源pitchbook
這些AI獨角獸的成長速度遠快於非AI獨角獸,前25%的AI公司在不到2.5年內就已經達到獨角獸估值。同時,最大規模的交易也流向了AI的初創企業。
另一個趨勢是——融資額正在變大,頭部效應更加明顯。根據第三方資料分析機構Pitchbook的資料,2024年,光是北美的風險投資總金額達到了2164億美金,較2023年增長了28%。其中2024年四季度,北美地區的融資額達到了771億美金,創下了2年以來的新高,光是人工智慧相關專案的投融資額達到了991億美金,佔到了總額的45.8%,達到了歷史最高水平。過去美國最大的10筆風險投資交易每年通常佔總融資額的9%左右,而自2023年以來,這一比例升至20%。
過去一年,我們在矽谷,這個北美將近50%投融資發生的地區以及最能夠代表北美創投發展的地方,捕捉到最新的一些變化並試圖梳理出最前沿的趨勢:
首先,針對人工智慧創投領域,有四大行業趨勢值得關注:
1、如果說2023年的AI Agent,只是停留在諸如斯坦福小鎮這樣的虛擬世界;2024年,AI Agent的商業化條件逐漸成熟;2025年則是Agent AI商業化的元年,資本的關注和注入加速,會加劇各大科技公司和初創企業在Agent AI 領域的競爭,推動技術創新和產業應用的落地。
2、一方面圍繞生成式AI基礎設施的投資規模空前,帶動了一系列產業鏈公司;另一方面,業界正在嘗試一些低成本、價效比高的做法,減少訓練的投入卻能達到與GPT-4/4o等同的效果;
3、專有AI模型正在釋放AI潛力,他們正在解決通用大模型不能解決的問題,逐步具備較高的商業化潛力。
4、生成式介面將迎重大發展,使用者能夠有更好的互動體驗,將帶來新的商業模式和市場機會。
其次,在人工智慧的技術方面,我們總結了八大趨勢:
1、2025年,大模型將更加關注多模態的融合與互動,其訓練方法正在不斷最佳化;
2、一直以來,儘管大模型能力在不斷增強,但仍無法解決人工智慧的“黑箱”問題。2024年,許多公司陸續推出了更透明的模型架構和解釋工具以緩解“黑箱”帶來的麻煩。2025年,可解釋性工具將進一步普及;
3、2024年,大模型的長期記憶能力迎來了一系列技術突破。2025年,隨著多模態技術的進步,跨模態記憶融合將在影片、文字、觸覺和嗅覺資料的編碼上取得突破,進一步提升模型的記憶能力。
4、合成數據作為加速大模型訓練的方法,將在2025年進一步發揮潛能。
5、2025年,隨著更強大的計算資源的普及和最佳化,規模定律將繼續提升,這使得更多的中小型企業可以進入AI領域,加速了大模型的普及,效率躍遷曲線下,大模型的成本更低了。
6、2025年,強化學習(RL)與大語言模型的結合有望進一步提升模型的泛化能力,並使得從預訓練到後訓練和推理遷移的轉變成為可能。
7、隨著AI應用場景的多樣化,簡化演算法架構將成為AI發展的重要方向。2025年,更多最佳化演算法將被用於強化學習等領域,以減少計算資源的消耗。
8、隨著AI蒸餾技術的普及,相關的法律和監管框架也需要不斷加強,以確保在模型開發和應用過程中不會侵犯智慧財產權或資料隱私。
另外,在人工智慧的應用方面,2025年也有了一些新的變化:
1、2025年,企業級AI應用迎來深入發展,越來越多企業將從人工智慧中獲利。AI Agent成為行業顛覆性力量,生成式AI推動傳統行業進入智慧化時代。隨著企業在生成式AI上盈利,商業模式轉變為按工作成果收費,取代傳統的SaaS席位收費。
2、2025年對於AI應用來說,下一個重大事件將屬於消費。我們期待一個“殺手級”AI消費應用的誕生。
3、在AI應用端,企業不再依賴單一模型,而是會根據不同的應用需求和場景,將不同模型模組進行組合,定製出符合自己業務需求的模型。
趨勢一 :2025年,AI Agent元年拉開序幕
人工智慧未來學家雷·庫茲韋爾 (Ray Kurzweil)表示,2025年,我們將開始看到從聊天機器人和影像生成器向“代理”系統的轉變,這些系統可以自主完成任務,而不僅僅是回答問題。人工智慧系統正在從單一的互動模式,走向專門且相互關聯的代理。
AI Agent,也稱為人工智慧代理,通常是指能夠感知環境、進行自主理解、決策和執行動作的智慧體。根據諮詢公司來覓PEVC的統計,自2024年以來,全球AI Agent賽道的融資金額已突破665億元人民幣。從整體來看,這些資金主要流向了在技術與市場潛力方面處於領先地位的頭部企業。
科技巨頭紛紛佈局AI Agent,以搶佔未來智慧互動的制高點。2024年,OpenAI憑藉其強大的技術實力和廣泛的市場應用,官宣65億美元新融資,成為萬億獨角獸,也成為全球AI Agent領域的主要資金流之一。埃隆·馬斯克創立的xAI,希望將AI Agent與人類深度整合,建立全球首個AI Agent與人類共存的社交平臺,xAI在2024年12月完成60億美元融資,估值達到了近500億美元。谷歌也全力推廣商用AI Agent,釋出了全球為數不多的商用AI Agent市場,為企業提供一站式開發、部署和應用生態。微軟在2024年11月的Ignite大會上宣佈已建立全球規模最大的企業級AI Agent生態系統,企業使用者可透過Azure AI目錄訪問超過1800個AI模型。此外,微軟的Copilot Studio平臺已支援使用者建立自主Agent,並正式進入預覽階段。蘋果也在開發者大會上展示了其最新的AI成果Apple Intelligence。
2025年,OpenAI推出的智慧體功能(AI Agent)以及一系列基於生成式AI的智慧系統,它們開始具備真正的自主學習和推理能力,從單一任務的執行者,轉變為能夠進行多工處理、複雜決策和互動的智慧體——1月24日,OpenAI釋出了一款代號為“Operator”的全新AI Agent產品,與其他各家Agent相比,它會透過自有的CUA(電腦控制Agent)系統進行復雜的思維鏈反思和步驟規劃,這可以大大提高其完成任務的精度和複雜性。Operator的創新之處在於其成功實現了從認知到執行的完整閉環。這一能力的拓展不僅是技術上的突破,更是AI技術邁向更高層次發展的關鍵一步。
AI Agent不再是單一的輔助工具,而是可以獨立進行深度學習、理解和推理的智慧系統,賦能企業和個人高效完成複雜任務,推動生產力的大幅提升。2025年,AI智慧體的全面普及將不僅改變技術產業的格局,還將在各個領域深刻影響人類的生活方式,從而使這一年成為AI Agent真正嶄露頭角的元年。
趨勢二:基礎設施軍備競賽:投資空前,低成本做法漸成趨勢
一年多以前,基礎大模型製造商OpenAI,在晶片製造商英偉達生產的25000個最新進GPU叢集上訓練了GPT-4。隨後,馬斯克表示他在一個數據中心有100000個GPU,並計劃購買200000個。
頭部公司透過大規模資金投入,搶佔人工智慧基礎設施的制高點,而以英偉達為代表的硬體廠商也在以前所未有的速度上不斷突破技術極限。例如,英偉達的頂級晶片效能相當於300部高階iPhone的處理能力。
在這場基礎設施競爭中,埃隆·馬斯克的X平臺部分業務——xAI的“Colossus”訓練叢集,成為世界上最強大的人工智慧訓練叢集之一。這個叢集僅用122天便建成,預算高達30億至40億美元,成為人工智慧基礎設施建設的里程碑。目前,xAI計劃將叢集容量翻倍,進一步增強處理能力。Meta也在大規模投資硬體,近期公佈了其24000個GPU資料中心規模叢集的兩個版本,旨在支援其下一代人工智慧模型。
雖然目前GPU叢集比傳統資料中心小,但對人工智慧計算不斷增長的需求將需要大規模的基礎設施擴充套件。包括Meta、亞馬遜、Alphabet和微軟在內的主要科技公司正在推動對人工智慧基礎設施的空前投資。超大規模資料中心運營商預計2024年資本支出(CapEx)將超過 2000 億美元,到2025年這一數字預計將接近2500億美元。儘管並非所有支出都直接與人工智慧相關,但很大一部分都分配給了人工智慧,並且這個份額在不斷增加。微軟和OpenAI已討論推出一個專門用於人工智慧工作負載的5千兆瓦資料中心,可能耗資超過1000億美元,甚至可以買得下一艘最新型核動力航空母艦。
在這場人工智慧基礎建設中受益的,是這個產業鏈中的組成部分。
第一類就是資料中心的託管服務提供商——也就是向大公司提供資料中心租賃容量的公司,他們是資料中心市場的重要組成部分。這批資料中心的託管服務提供商如今也在拓展其以人工智慧為重點的基礎設施服務。例如,超大規模託管領域的領導者 Equinix 已獲得近 150 億美元的資金用於在美國建設人工智慧資料中心,主要為客戶提供基礎設施,以訓練和部署大規模私有人工智慧模型,這些客戶往往是科技行業以外的財富 500 強公司。
另一類受益者則是人工智慧資料中心建設中的輔助產品,例如低功耗CPU、記憶體、儲存系統、網路元件以及冷卻和電源管理裝置。冷卻產品供應商 Vertiv在2024年7月至9月的三個月內實現了19%的同比收入增長,並提高了未來12個月的業績指引。
第三類則是圍繞資料中心能源生產、熱管理和電源管理解決方案的公司。Alphabet董事長在2023年2月表示,與LLM互動可能比標準關鍵字搜尋的花費高出10倍。另外,根據谷歌研究員Urs Hölzle的文章提及,標準Google搜尋使用的電力為0.3Wh,這意味著每次LLM互動的耗電量約為3Wh。這個數字與SemiAnalysis在2023年初對ChatGPT運營成本的評估一致,該評估估計ChatGPT每次請求耗電量為2.9Wh,如果每天響應1.95億個請求,估計平均每天耗電量為564MWh。
《紐約客》報道稱,ChatGPT每天用電量相當於1.7萬個美國家庭的用電量。如果基於當前模型和技術,讓每個標準Google搜尋都變成 LLM 互動,對 Google總用電量的潛在影響巨大。第三方分析機構SemiAnalysis估計,帶有大模型互動功能的谷歌搜尋單次請求的用電量達到將近9Wh,谷歌每天搜尋大約需要90億次,則需要81000MWh。
這一趨勢促使人們對位於資料中心設施附近的核能和能源生產等技術以及熱管理和電源管理解決方案進行投資。
不過,如今科學家和業界正在尋找更聰明並且資源密集度更低的方法來解決訓練人工智慧模型所需要的算力和能源問題。例如透過蒸餾技術,這項技術的踐行者——DeepSeek,這家國產大模型也給美國矽谷提供了更多低成本的訓練參考。DeepSeek大模型效能在多個方面比肩OpenAI,其中DeepSeek V3,整個訓練過程僅用了約2000張二流晶片進行訓練,官方稱成本僅佔用約550萬美元,而Meta的模型則使用了16000個性能最強的一流晶片。並且,DeepSeek-R1透過重新設計訓練流程、以“少量SFT資料+多輪強化學習”的辦法,在提高了模型準確性的同時,也顯著降低記憶體佔用和計算開銷,每百萬輸出tokens16元,大約是OpenAI o1執行成本的三十分之一。
在這樣的競爭壓力下,0penAI推出了其成本更低的o3-mini,比o1-mini便宜63%,比完整的o1模型便宜93%,每百萬tokens的進出費用分別為1.10美元/4.40美元(享有50%的緩存摺扣)。谷歌釋出的Gemini 2.0 Flash-Lite是Gemini 2.0系列的新變體,每百萬tokens0.3美元,是谷歌目前最便宜的模型。
可以窺見,在AI產業的競爭中,降低訓練成本、提高計算效率和最佳化模型效能已成為企業的主要競爭策略。尤其是訓練流程的最佳化,成為了公司在大模型市場中佔據競爭優勢的關鍵能力之一。2025年,低成本做法也將成為行業的主流趨勢。
此外,一些大公司也在開發專用人工智慧晶片,例如谷歌、蘋果、微軟和OpenAI,這些專業晶片可以比英偉達這樣通用處理器執行更高效;或是採用一些方法提高晶片的使用效率,例如用多種模型,每種模型針對不同問題,以此來縮短晶片的處理時間等。AI推理晶片製造商Groq2024年估值達到28億美元,在Blackrock領投的新一輪中融資6.4億美元,其專為AI推理任務設計的晶片“語言計算單元”(LPU, language processing unit)能以現有解決方案1/10的價格、10倍的速度執行與ChatGPT、GPT-4o相似的模型。目前,在Groq開發的、對標英偉達CUDA的軟體開發平臺GroqCloud平臺上,約有40萬開發者。
趨勢三:專有模型有望釋放AI的應用潛力
大模型就像個通才,然而,在一些專業領域,大模型往往缺乏針對性和操作性。為了突破這一瓶頸,越來越多的公司開始專注於開發專有模型,透過在特定領域資料上微調模型,實現更高效的工作流程自動化,提供更具操作性和任務導向的工具。這一趨勢正在逐步升溫,並在多個行業展現出巨大的應用潛力。以下為一些具體的案例:
金融服務領域,提升決策效率與洞察力:摩根大通和彭博社等機構正在利用其龐大的內部資料集開發大語言模型,以提升運營效率和決策能力。這些模型能夠提供獨特的市場洞察、風險分析和報告生成。例如,彭博社於2023年開發了BloombergGPT,專注於金融領域的資料分析和預測,透過微調金融資料,能夠更高效地處理複雜的金融任務,如市場趨勢分析和投資策略制定。
網路安全領域,精準檢測與應對威脅:美國網路安全解決方案提供商Palo Alto Networks正在訓練自有的大語言模型,這些模型能夠幫助安全專家更好地檢測和應對網路威脅。該公司在2024財年四季度披露了超過2億美元的AI相關經常性收入,同比增幅近四倍。AI大模型透過模擬複雜攻擊場景,幫助安全團隊快速發現系統漏洞並提供修復建議,顯著提升了網路安全的即時預警和使用者行為分析能力。
國防領域,用於軍事與情報分析:美國資料分析和軟體公司Palantir近期獲得了一系列合同,用於支援AI的服務,包括加速部署適用於國防和軍事領域的AI模型。這些模型能夠提升情報分析、目標識別和決策支援能力。例如,AI訓練平臺可以建立逼真的戰鬥場景,幫助士兵在安全環境下進行戰術訓練。此外,AI技術在軍事領域的應用還包括無人化作戰系統和沉浸式訓練模擬。
生命科學領域:2024年,科研人員使用AI的比例快速增加,AI對科學研究方法和流程的變革效應也開始顯現。比如,AlphaFold 3.0在2024年釋出,不僅提高了蛋白質結構預測的準確率,還擴充套件到了DNA和RNA等生物分子的研究,這項技術幫助科學家快速預測藥物分子與目標蛋白質的結合情況,大大提高了藥物研發的效率。2025年,多模態大模型將進一步融入科學研究,賦能多維資料的複雜結構挖掘,輔助科研問題的綜合理解與全域性分析,為生物醫學、氣象、材料發現、生命模擬、能源等基礎與應用科學的研究開闢新方向。
除了上述領域,專有模型還在其他行業展現出廣泛的應用前景。例如,Two Sigma在量化投資中使用AI Agent進行選股策略,透過分析財務資料和宏觀經濟指標,識別潛在的投資機會。Shopify Sidekick則利用LLama 2生成產品描述、回應客戶查詢和建立營銷內容,幫助小企業主提升運營效率。
專有模型透過在特定領域的資料上進行微調,能夠提供更具針對性和操作性的解決方案。這種趨勢不僅提升了各行業的自動化水平,還為企業帶來了顯著的運營效率提升和成本降低。隨著AI技術的不斷發展,未來專有模型將在更多領域得到廣泛應用,成為推動行業創新的重要力量。
趨勢四:推動動態自適應介面,實現高度個性化的互動體驗
生成式介面(Generative Interface)是指利用生成式模型,如生成對抗網路(GANs)或變分自編碼器(VAEs),自動建立使用者介面元素或互動流程。這種介面不是透過傳統設計方法人工製作,而是透過機器學習演算法根據輸入的資料、需求或上下文生成。
在2024年,生成式使用者介面(Generative UI)在動態和自適應介面、AI與演算法融合、個性化體驗等方面取得了顯著進展。大規模生成式預訓練模型(如GPT系列、DALL·E等)已被廣泛應用於自動化介面設計。開發者藉助這些模型,可以快速生成和調整介面元素,如按鈕、佈局、色彩搭配等,甚至可以根據使用者反饋即時調整介面的外觀和功能。
此外,生成式介面逐步在增強現實(AR)和虛擬現實(VR)環境中得到應用,尤其是在需要複雜互動的沉浸式體驗中,AI幫助生成自適應、動態變化的虛擬介面。例如,英偉達在2024年SIGGRAPH大會上展示了利用即時生成式AI建立沉浸式沙漠世界的研究成果。此外,英偉達還透過Holoscan技術賦能手術機器人,加速AI技術在醫療實踐中的應用。這些應用展示了生成式AI在動態生成虛擬介面方面的潛力,尤其是在需要高度沉浸感的場景中。
可以說,隨著使用者需求變得更加多樣化和複雜,傳統的固定介面無法滿足個性化的互動需求。動態自適應介面能夠根據使用者的行為、偏好和環境變化即時調整顯示內容和功能,提供更加定製化的體驗。
展望2025年,生成式介面將迎來重大發展,成為推動使用者體驗變革的關鍵力量。越來越多的應用將採用基於使用者互動和邏輯工作流程自適應的動態使用者介面。生成式UI將使應用能夠自動生成表單、儀表板或視覺化等介面元素,這些元素將根據使用者的具體需求和操作量身定製。例如,Web開發平臺Vercel和Bolt.new等公司正在開發能夠建立高度適應性和個性化使用者體驗的平臺,提供即時演進的介面,以滿足不斷變化的需求,從而簡化工作流程。
#03
八大技術趨勢,推動AI泛化能力
趨勢一:多模態能力的增強和整合
2024年,多模態AI取得了顯著進展。OpenAI、Google DeepMind等機構推出了更強大的多模態模型,如影片生成模型Sora的誕生、OpenAI多模態AI大模型GPT-4o的到來、CLIP模型透過跨模態表示實現圖文搜尋,使用者可以透過輸入文字搜尋相關影像或影片。此外,文字到影像生成(如DALL·E、Stable Diffusion)和影片生成模型也取得了顯著進展,進一步拓展了AI的互動體驗。
大模型逐步增加了能夠處理影像、音訊或影片等多種輸入形式。這些模型不僅提升了AI對複雜資訊的處理能力,還拓展了其應用領域。在谷歌雲釋出的《2025年AI商業趨勢》報告中,多模態AI被放在首位。谷歌雲預測,2025年將成為企業採用AI技術的關鍵一年,這一趨勢主要由多模態學習及其實現的情境感知所驅動的,並預計2025年全球多模態AI市場規模將達到24億美元。
2025年,大模型將更加關注多模態融合與互動。AI不僅能夠生成文字,還能理解影像、影片中的上下文,甚至在多模態環境中進行決策。比如,結合視覺與語音的能力,模型能夠更好地理解複雜的場景,並做出合適的反應。
此外,多模態模型的訓練方法也在不斷最佳化,例如採用分階段訓練策略,先固定大語言模型的權重引數,對影像編碼器和橋接元件進行初步訓練,再進行整體訓練,從而提升模型效能。
趨勢二:大模型的可解釋性表現更強
可解釋人工智慧 (xAI) 是人工智慧領域的一個新興領域,致力於使人工智慧系統對人類更加透明、可解釋和可理解。xAI的興起源於人們對人工智慧決策過程透明度和問責制的需求日益增長,尤其是隨著人工智慧系統變得越來越複雜並部署在金融、法律或醫療保健等高風險領域。例如,考慮醫院用於篩查患者X光片的腫瘤檢測 CNN(卷積神經網路) 模型的情況。但是,當技術人員或患者不知道其工作原理時,他們如何能相信其結果?這正是我們需要方法來了解影響任何深度學習模型決策的因素的原因。
另外,AI的安全性問題是一個不可忽視的關鍵挑戰。尤其是大模型在做出決策時的“思考過程”對於使用者和開發者來說變得不透明,就像一個“黑箱”,其決策過程難以解釋和追蹤。若這些模型未經過嚴格的審查和驗證,它們可能會做出無法被察覺的有害決策,甚至加劇社會偏見和不公。因此,加強對大模型的監控、審查和可解釋性要求是提升AI系統安全性的重要一步。
2024年,大模型的可解釋性取得了重要進展。OpenAI、Google DeepMind等機構推出了更透明的模型架構和解釋工具,如GPT-4的可解釋性增強版本和Gemini的跨模態解釋功能。LIME、SHAP等後驗解釋方法被廣泛應用於醫療、金融等領域,幫助使用者理解模型決策依據。同時,自監督學習和符號AI的結合提升了模型的內在可解釋性,減少了“黑箱”問題。行業也開始重視可解釋性的標準化,例如歐盟《人工智慧法案》要求高風險AI系統提供清晰的決策解釋。
2025年,可解釋性工具將進一步普及,將模型將內建更強大的解釋能力,即時生成決策依據,並支援多模態資料的跨模態解釋,幫助使用者理解複雜AI模型的決策過程。透過一些自主進化模式或可解釋性工具,將模型將內建更強大的解釋能力,即時生成決策依據,並支援多模態資料的跨模態解釋。可解釋性與效能的平衡將得到最佳化,知識蒸餾和模型壓縮技術將幫助簡化複雜模型的同時保持高精度。行業專用可解釋性工具將普及,滿足醫療、金融等領域的合規需求。
以DeepSeek為例,透過純演算法自主進化的Zero模式與僅需數千條人工標註資料的R1模式組合,既保留模型自主進化能力又保障人類可解釋性————Zero模式使得模型能夠自我進化和發現數據中的規律,而R1模式透過引入人工標註資料為模型提供了一個監督和解釋的框架。這種結合確保了模型在保持自主學習能力的同時,也能夠被人類理解和控制,從而提升了可解釋性。
此外,倫理和隱私保護將深度融入可解釋性設計,確保AI系統既透明又安全,推動大模型在高風險場景中的廣泛應用。以下是一些提升的方向和工具:
○ 自監督學習與模型可解釋性:透過自監督學習,AI系統可以在缺乏大量標註資料的情況下,透過理解資料的內在結構來進行學習,這種方法有助於提升模型的透明度,使得我們能夠更好地理解其學習過程。
○ 生成對抗網路(GANs)和模型蒸餾:透過生成對抗網路和蒸餾技術,開發者能夠簡化複雜模型,同時保持高效性和準確性,這種方法使得大規模深度學習模型更加易於解釋。
○ 增強推理框架和視覺化工具:新一代的AI推理框架將更注重視覺化,幫助使用者以更直觀的方式理解模型決策的依據。例如,基於影像或文字的AI系統,新的視覺化工具可以清晰展示模型如何關注不同的輸入特徵,從而提升其可解釋性。
需要一提的是,未來AI的安全不光需要提升可解釋性,還需要著重於法律合規性、安全審計和濫用防範等方面,推動AI技術的負責任應用。隨著技術的不斷發展,AI如何在不斷的創新中確保安全,將成為AI領域面臨的重大挑戰之一。
趨勢三:大模型長期記憶能力迎來深層次變革
目前的許多大模型(如基於Transformer架構的模型)在處理長文字或複雜上下文時,常常會面臨資訊丟失等問題。傳統模型一般有固定的“記憶視窗”,當文字或輸入資訊過長時,模型往往會忘記最初的資訊,或者在處理過程中只關注較近的上下文。長期記憶的核心需求是讓模型能跨越多個時刻、任務和場景記住資訊,並能在合適的時機提取和利用這些資訊。
大模型的長期記憶能力迎來了一系列技術突破。首先,在上下文視窗的擴充套件上,比如2024年,Google Gemini 1.5 Pro突破性地實現了最高可達1000萬token的處理能力。到2025年2月釋出的Gemini 2.0全家桶,最強Pro版本可支援到2M上下文。
其次,外部記憶系統的引入推動了大模型記憶能力的發展。如IBM WatsonX的即時知識圖譜更新功能使得在醫學診斷等特定領域的記憶準確率提高了35%。持續學習機制方面,Meta的LoRA-X架構透過引數隔離技術降低了多工干擾,OpenAI則部署了分散式記憶訓練系統,使百萬裝置協同進化,提升了記憶系統表現。在記憶檢索方面,Anthropic的ContextRouter模組和微軟的MAVEx系統分別透過動態記憶權重分配和跨模態聯合檢索,優化了記憶檢索的準確性與效率。
第三,隱私與安全問題也得到了關注,Google推出的Memory Provenance框架增強了記憶的透明度和可控性,而HuggingFace的SafeMemory工具包透過差分隱私技術將隱私洩露的風險大幅度降低。這些技術突破使大模型的長期記憶能力得到了顯著提升,推動了多個領域的應用發展。
2025年,大模型的長期記憶技術將迎來新的發展趨勢。如混合視窗架構或將成為上下文處理的新正規化,能夠根據任務需求動態調整區域性和全域性注意力的範圍,大幅度提升處理效率。隨著多模態技術的進步,跨模態記憶融合將在影片、文字、觸覺和嗅覺資料的編碼上取得突破,進一步提升模型的記憶能力。記憶許可權管理和記憶遺忘機制將更加成熟,為隱私和安全提供更強保障。
此外,隨著使用者對個性化和定製化的需求不斷提升。個性化記憶系統能夠根據使用者的特定需求、偏好和行為習慣構建專屬的記憶圖譜。例如,AI助手可以記住使用者的興趣、常用的命令、偏好的回答風格等,從而提供更加精準和符合需求的回覆。2025年,個性化記憶系統也將成為大模型發展的重點方向,大模型能夠根據使用者需求構建專屬記憶圖譜,提高個性化回覆的準確性,並透過跨裝置記憶同步實現即時更新。
不過,儘管大模型在長期記憶方面取得顯著進展,但仍面臨技術挑戰,包括記憶衝突解決、多來源記憶的置信度評估體系、能耗瓶頸和認知偏差防控問題。商業應用方面,醫療、教育和金融等行業將受益於大模型長期記憶能力的提升,預計能夠降低誤診率、提升知識留存率並加速風控響應速度。
趨勢四:合成數據或加速大模型訓練
隨著人工智慧技術的飛速發展,資料成為推動AI進步的核心資源。2025年,合成數據作為加速大模型訓練的一種重要方法,正在成為AI發展的關鍵趨勢。馬斯克在2025年CES(消費電子展會)的訪談中提到,隨著人類累積的知識幾乎被AI訓練完畢,未來的AI系統將不得不依賴合成數據進行自我生成和學習。這一觀點突顯了合成數據在未來AI技術發展中的潛力。
目前,多個科技巨頭已經開始在AI模型訓練中廣泛應用合成數據。微軟、Meta、OpenAI和Anthropic等公司紛紛將合成數據作為增強模型訓練效率和拓寬訓練資料來源的有效手段。例如,2024年下半年釋出的Llama 3.1、o1、DeepSeekV3和Phi-4等模型均報告了使用合成數據進行訓練。根據科技市場研究機構Gartner的預測,到2024年,AI及分析專案中使用的資料中,60%以上將來自合成數據。合成數據能夠幫助AI系統在真實資料難以獲得或標註成本過高的情況下,生成具有代表性且符合特定任務需求的資料,大幅降低了對實際資料的依賴。
然而,合成數據的使用仍然面臨諸多挑戰與爭議。2024年7月,《Nature》期刊刊登的論文指出,LLM生成的合成數據可能會汙染下一代模型的訓練集,導致模型效能下降,甚至發生“崩潰”。這一風險類似於“資料中毒”問題,嚴重時可能讓模型無法做出有效的推理和判斷。英偉達也釋出了其Nemotron-4 340B開源模型,聲稱使用了98%的合成數據,但同時也強調需要加強合成數據的質量控制,以避免潛在的負面影響。
儘管面臨風險,但合成數據在加速大模型訓練方面的潛力仍然巨大。尤其在高效能計算和多模態資料融合等領域,合成數據可以快速擴充套件訓練集的規模,並提供更多樣化的訓練情境。為了應對合成資料帶來的挑戰,AI研究者正在不斷最佳化生成資料的質量和多樣性,例如透過強化學習演算法對合成資料進行校正,或者結合人類監督和自動化評估機制來減少“資料汙染”風險。
展望未來,隨著技術的不斷進步,合成數據有望成為AI訓練中的重要組成部分。它不僅能加速模型的訓練過程,還能在資料匱乏或難以獲取的領域,為AI發展提供新的動力。
趨勢五:大模型普及加速,效率躍遷曲線下成本更低了
在2025年1月,Anthropic的CEO-Dario Amodei 發表了一篇長達萬字的深度分析報告。肯定了DeepSeek的技術突破:其最新模型在特定基準測試中已逼近美國頂尖水平,並嘗試從三個維度將中國的AI進步納入全球技術演進座標系進行定位:算力規模定律、效率躍遷曲線、正規化革新動能。
這些維度的選擇反映了他對國產AI評估方面的理解:關注硬體和計算能力的提升(算力規模定律),技術的效率提升(效率躍遷曲線),以及新技術正規化的創新和推動力(正規化革新動能)。這種全方位的定位方式,能夠精準捕捉到AI大模型在全球技術演進中的角色及潛力。具體我們解釋下這三方面的重要性和趨勢:
首先,規模定律是推動大模型發展的基礎。隨著硬體技術不斷進步(如更強大的GPU、TPU和專用AI晶片),訓練超大規模模型已變得越來越可行,同時也驅動了雲計算和分散式計算的發展,進一步降低了成本。隨著更強大的計算資源的普及和最佳化,規模定律將繼續提升,這是2025年AI大模型的關鍵能力趨勢之一。
其次,關於效率躍遷曲線,曲線偏移指的是技術創新帶來成本曲線的變化,使得原本高昂的訓練成本能夠透過硬體最佳化、模型架構改進等手段大幅降低。這不僅能夠降低AI研發的門檻,還能加速技術迭代。比如2024年,硬體創新如量子計算、專用AI加速晶片推動AI訓練成本的快速降低。同時,AI框架的最佳化(如更高效的深度學習框架)和演算法改進幫助實現了更少計算資源的更高效訓練。
在前文中我們也提到了,目前對於AI基礎設施方面軍備競賽激烈,低成本做法漸成趨勢,尤其是DeepSeek透過採用OpenAI等先進模型,利用蒸餾技術將其知識轉移。這一過程使得DeepSeek能夠在保持較高效能的同時,顯著減少訓練所需的計算資源和時間。透過模仿OpenAI模型的輸出,“學生模型”能夠快速學習複雜的模式和推理能力,加速模型的最佳化過程。2025年,隨著硬體和演算法的進一步突破,AI開發成本將大幅下降,這也使得更多的中小型企業可以進入AI領域。
此外,新的訓練正規化(如強化學習、無監督學習等)正在改變AI的學習方式。2020到2023年,AI主要依賴預訓練模型,使用大量網際網路文字進行訓練,並透過少量額外訓練進行微調。然而,到了2024年,強化學習(RL)成為新的重點,透過強化學習生成思維鏈,AI在數學、程式設計和推理等任務上的表現顯著提升。初期階段投入較少,但效果顯著。
強化學習和自監督學習等新興正規化逐漸在機器人、自動化和多模態學習領域得到應用,尤其提升了機器人在動態環境中的自主學習和決策能力。到2025年,這些新訓練正規化預計將成為AI發展的主流,尤其在複雜任務處理上(接下來趨勢六我們會進一步解釋)。
趨勢六:預訓練到後期訓練和推理遷移轉變
2024年是AI技術飛速發展的一年,尤其是在大語言模型(LLM)和多模態技術方面取得了顯著突破。這一年,AI從單一模態向多模態融合邁進,大語言模型透過擴充套件上下文視窗和採用混合專家架構(MoE)等技術,顯著提升了推理和生成能力。同時,強化學習(RL)開始與大語言模型結合,為模型的泛化能力提升提供了新的方向。此外,AI在醫療、金融、自動駕駛等領域的應用不斷深化,推動了行業變革。然而,隨著模型規模的擴大,預訓練階段的效能提升逐漸放緩,行業開始探索後訓練和推理遷移的新模式。
2025年,AI技術將進入一個新的發展階段,Scaling Law的擴充套件將成為關鍵趨勢之一。強化學習與大語言模型的結合(RL+LLMs)將進一步推動模型泛化能力,從預訓練向後訓練和推理遷移轉變。
這種模式將使AI在特定場景下的表現得到顯著提升,同時降低訓練成本,提高模型的適應性和靈活性。此外,AI將在更多領域實現落地應用,如智慧駕駛、具身智慧等,這些領域將迎來技術突破和商業化的加速,但也與此同時會帶來更多的安全和風險管理挑戰。因此,AI安全和治理將成為行業關注的重點。
需要強調的是,大規模語言模型(LLM)的預訓練階段已經接近瓶頸,主要受到資料、計算資源和模型規模增長的限制,且在通用性提升上邊際效益遞減。部分研究人員和行業專家擔心,對於大規模語言模型而言,傳統擴充套件方式已接近極限。生成式AI已遇瓶頸。據外媒報道,像OpenAI這樣的公司在擴大技術應用時也發現困難重重,其他前沿實驗室也面臨更嚴重的挑戰。知名資料科學家Yam Peleg透露,一些實驗室試圖透過延長訓練時間和增加資料量來提升模型表現,但結果卻遭遇了“收益遞減牆”,且情況比公開報道的更為嚴重。
不過,儘管如此,預訓練依然為模型奠定了基礎,後續的最佳化潛力巨大。因此,在後訓練階段(如微調、強化學習、多模態對齊等)依然存在許多最佳化機會。透過領域特化、任務指令最佳化、模型壓縮等技術,可以提升模型在特定任務上的表現,同時提高其在資源受限環境中的部署效率和安全性。
趨勢七:更多最佳化演算法將被用於強化學習等領域
目前,深度強化學習(DRL)的最佳化演算法在多個行業取得了應用突破。為了解決傳統強化學習在高維度問題上訓練困難的問題,研究者採用了更加高效的演算法,如模仿學習和分層強化學習,顯著提升了模型的學習效率和訓練速度。比如Google DeepMind 推出的AlphaDev系統由兩個核心組成部分構成:學習演算法和表示函式。學習演算法是在先進的 AlphaZero 演算法基礎上進行擴充套件,結合了深度強化學習 (DRL) 和隨機搜尋最佳化演算法,以執行大規模的指令搜尋任務。
此外,RLHF(強化學習與人類反饋結合)的應用開始更加深入和精細。AI大模型開始透過更精確的人類反饋進行訓練,從而能夠更好地理解複雜任務,並且在人機互動中表現出更高的自適應能力。例如,OpenAI的ChatGPT透過使用者的即時反饋不斷最佳化對話能力,以提供個性化和上下文相關的回答。由於RLHF能顯著減少對大規模標註資料的依賴,更多AI系統開始透過少量高質量的人工反饋來進行高效訓練,從而降低了模型開發和訓練的成本。
還有近期處於話題焦點的DeepSeek,R1模型透過強化學習(RL)和基於人類反饋的強化學習(RLHF)進行訓練,並針對核心演算法模組做了大量的最佳化處理:比如改造 Attention 模組,透過低秩壓縮,讓KV Cache的效率達到最優。以及透過訓練架構瘦身—例如GRPO演算法透過省去傳統強化學習中必須的Critic模型(即"雙引擎"設計),將複雜演算法簡化為可落地執行的工程方案。一般傳統的強化學習模型通常採用這雙引擎”設計——Actor和Critic,Actor負責執行決策,Critic評估Actor的決策效果,二者需要同時進行訓練,這增加了計算量和訓練複雜度。透過去除Critic模型,GRPO演算法能夠簡化模型結構,降低計算資源的消耗。
隨著AI應用場景的多樣化,簡化演算法架構將成為AI發展的重要方向。2025年,更多最佳化演算法(如GRPO等)將被用於強化學習等領域,以減少計算資源的消耗,同時提高模型的執行效率和即時響應能力。
隨著硬體資源的不斷提升和演算法的進一步最佳化,像GRPO這樣的輕量級強化學習演算法將被廣泛應用於邊緣計算和低資源裝置上。例如,智慧裝置、物聯網裝置和機器人等領域,都會受益於這種簡化的演算法,實現在硬體條件有限的環境中高效執行。
趨勢八:低成本訓練與AI倫理,智慧財產權成為核心議題
春節期間,DeepSeek的DeepSeek-R1震撼了全球科技圈和資本市場,其基於知識蒸餾技術,成功將大型複雜模型的知識遷移到較小模型,實現高效部署。2月6日,斯坦福大學李飛飛團隊和華盛頓大學研究人員以不到50美元雲計算費用,成功蒸餾出一個名為s1的新推理模型,表現與OpenAI的o1和DeepSeek的R1相似,展示了蒸餾技術的強大潛力。基於競爭壓力,2月7日,OpenAI公開了o3-mini的推理思維鏈,但該推理思維鏈並非原始資料,OpenAI產品官Kevin Weil表示會找到平衡方式以避免被競爭對手蒸餾。
Kevin Weil的考慮出發點在於,蒸餾通常依賴於將一個較大模型的知識提取出來,並將其遷移到一個更小的模型。如果目標模型能夠有效地從源模型中獲取有用的知識,且沒有太大的效能損失,那麼理論上,很多模型都可以透過蒸餾技術進行簡化和最佳化。因此,隨著AI蒸餾技術的普及,相關的法律和監管框架也需要不斷加強,以確保在模型開發和應用過程中不會侵犯智慧財產權或資料隱私。
這種低成本訓練的模式也引發了業界關於AI模型智慧財產權和倫理問題的討論。隨著越來越多的研究依賴於現有基座模型進行微調,是否應當給予這些基座模型開發者相應的回報成為一個重要議題。同時,如何確保AI技術的公平使用和共享,也亟待業界深入探討和解決。
#04
下一個殺手級應用,可能在消費領域
趨勢一:越來越多企業從人工智慧上掙到錢
過去的2024年,是生成式AI的落地之年。而2025年,則是這些企業級AI應用在已有的落地場景中深入發展的一年。
美國風險投資機構Menlo Ventures在統計了600家美國企業的IT支出(包括模型支出、訓練&部署支出、AI應用支出,不包括晶片、雲計算等支出)情況後發現,2024年企業的AI相關支出達到了138億美元,相比2023年的23億美元增長了超過6倍。在這其中,應用支出的增速最快,6億美元增長到了2024年的46億美元。

資料來源:Menlo Ventures
企業AI相關支出的提高,讓不同的行業間接獲益。第一個受益的是諮詢公司。2024年,埃森哲和IBM等諮詢公司正在實現大幅的收入增長,其中,與人工智慧相關的服務對其營收增長貢獻顯著,客戶希望透過諮詢,瞭解實施人工智慧能夠獲得的競爭優勢。根據埃森哲披露,截至 2024 年 9 月,其生成式人工智慧諮詢預訂額近 30 億美元。
第二個從人工智慧中獲益的行業是雲計算和軟體公司。軟體公司ServiceNow自推出 “Now Assist” 以來,報告了強勁的生成式人工智慧預訂量,其首席財務官表示,在新產品系列中,最大新增年度合同價值貢獻,來自於人工智慧的採用。另外,軟體巨頭甲骨文的基礎設施即服務(IaaS)部門實現了強勁增長,這在很大程度上歸因於人工智慧工作負載的增加。資料中心的領導者Equinix也因為人工智慧基礎設施需求獲得了大量新合同。
另外,廣告行業也從人工智慧使用中獲益。根據Meta Platforms最近報告,在人工智慧的加持下,其廣告展示量增長了7% ,每廣告的平均價格增長了 11%,季度收入同比增張了19%。
亞馬遜集成了基於生成式人工智慧的產品影像生成工具,導致某些廣告活動的廣告展示量顯著增加。我們預計,隨著人工智慧服務需求的擴大,具有獨特市場定位、強大分銷渠道和特權資料訪問許可權的雲計算、軟體應用和基礎設施公司將成為主要受益者。隨著人工智慧市場的成熟,這些科技巨頭可能在 2025 年實現加速增長。
我們嘗試總結了生成式AI滲透率最高的幾個應用場景:AI程式碼、AI客服支援和企業級搜尋。
● 最高的是AI程式碼應用,企業對AI程式碼應用的採用率達到了51%,比如,頭部產品 Github Copilot 的ARR(年度經常性收入,是指企業每年從客戶那裡獲得的或期望從客戶那裡獲得的服務或產品回報的收入計算)達到了3億美金也真實的反應了使用者的需求。Cursor、Cognition 等新興工具在迎來使用者快速增長的同時,也獲得了資本市場的火熱追捧。
● 其次是AI客戶支援,其採用率達到了31%,產品為內部員工或外部使用者提供基於產品知識的客戶支援。Sierra、Decagon 等初創借力生成式AI的智慧,為使用者提供符合品牌調性和消費者畫像的定製化客服體驗,挑戰低效、無趣的傳統客服。
● 第三是AI資料檢索,其採用率達到了28%,這類應用幫助企業解鎖和利用分散在各組織中的資料,將資料孤島中的寶貴知識管理利用。例如一家初創企業Glean,其業務是企業級搜尋,旨在為企業打造內部的Google,核心產品 Glean Assistant 的使用者每天平均查詢 14 次,遠超Google的日均查詢次數。在過去一年ARR(年經常性收入,Annual Recurring Revenue)達到了5500萬美金。

資料來源:Menlo Ventures
2024年,企業60%的AI應用支出來自企業創新業務的預算,說明企業使用這些應用的態度以嘗試和探索為主,生成式AI在企業應用場景中的落地尚處於早期階段。接下來,隨著企業未來各個部門對於生成式AI應用的預算持續增長,哪些生成式AI應用能為企業帶來實實在在的回報率,哪些或將分得持續性更長、規模更大的預算,從而支援生成式AI應用生根發芽、斬獲1億美金甚至更多ARR。
①AI Agent正在給企業帶來效益
2025年,生成式AI應用正在生根、發芽,給企業帶來實實在在的現金回報,基於這樣的趨勢,AI Agent將是這個商業環節閉環的關鍵。
AI Agent從學術走向商業落地,僅花了三年時間。
AI Agent的第一波高潮來自2023年年初,AutoGPT的火爆,所謂AutoGPT,其實是把學術圈很多的Agent idea簡單呈現出來,儘管其讓開發者感受到大模型的強大,但很快大家便發現,AutoGPT的實驗性強於實用性,難以解決大部分的實際問題。第二波高潮來自2023年9月,AgentGen,透過構建不同職能的Agent,分工協作。
到了2024年,AI Agent開始從實驗走向現實。
2024年末,OpenAI執行長Sam Altman提出了AGI(通用人工智慧)的五層框架:
Lv1 – Chatbot,具備基礎的對話能力,能夠理解和回應簡單的文字輸入
Lv2 – Reasoner,具備基本的邏輯推理能力,能夠分析複雜資訊並進行推斷
Lv3 – Agent,具備理解複雜指令的能力
Lv4 – Innovator,具備創新和創造的能力
Lv5 – Organizer,具備協調和管理龐大系統、資源和團隊的能力
他提出,如今我們正處於第二個階段並非常接近第三個階段的狀態。
Lv3的Agent智慧體能夠自主與環境互動、收集資訊,具備持續規劃並執行多步驟、長時間任務的能力。要達成這個階段,需要一個推理能力、邏輯能力更強的模型(可能是o1的下一個版本、也可能是對標o1的開源模型)。同時,服務AI Agent應用的基礎設施也必不可少。
當下,企業出於安全性、準確性、穩定性等因素的考量,更傾向於使用 AI Copilot (人在迴路中參與)增加人在工作流中的效率,而不是直接採用端到端自動化 AI Agent。隨著底層模型能力和Agent框架開發的持續升級,Agent應用將為企業提供更智慧高效的數字員工。人與AI的協作關係將從AI賦能人工作,逐漸轉變到人監督指導AI完成工作,最終達到AI自主完成工作。這個轉變會在未來幾年迅速發生。
至於適合AI Agent最先產生價值的應用場景,2025年大概將延續現階段生成式AI滲透率高的場景,例如程式碼程式設計、客服、銷售、營銷等。
根據第三方機構Menlo Ventures的調查資料顯示,企業內各部門的生成式AI預算劃分中,IT部分獨佔鰲頭(22%)、產品和工程開發次之(19%),客服(9%)、銷售(8%)和營銷(7%)緊隨其後。

資料來源:Menlo Ventures, UpHonest Capital
根據矽兔賽跑的觀察,一些企業的確正在從這幾個場景中賺錢:
IT部門選擇之一的初創公司Glean,在2024年9月份完成新一輪融資,估值達到46億美元,其旨在最佳化企業內部資料檢索和問題答覆。
在產品和工程開發部門依賴的AI程式設計應用中,初創公司Cognition在2024年3月推出了首個AI程式設計師Devin,成立僅6個月就達到了20億美金估值。同年12月其Agent產品Devin正式上線,區別於普通的程式碼補全應用,Devin能夠無需人類參與進行自主編碼,完成需要人類工程師參與的專案開發。目前 Devin擁有諸多頭部客戶:例如Ramp 使用Devin 編寫測試程式碼並清理死亡程式碼,MongoDB使用 Devin 更新過時的程式碼架構。
矽谷投資機構UpHonest Capital早期投資的Cosine,正在打造全自動的AI軟體開發助理Genie,曾在SWE-Bench測試中獲得全球最高分數。Cosine 研發了獨有的資料管道,能夠生成具有人類工程師開發邏輯、增量知識、支援搜尋的高質量資料集。同時,Cosine是OpenAI最大的模型微調合作夥伴,擁有其前沿模型的早期使用許可權。結合資料和模型優勢,Cosine已經與多家世界500強公司和明星初創公司達成合作。
客服作為人力密集型工作,也將成為AI Agent最先顛覆的環節。比如UpHonest Capital早期投資的Proactive AI 正在為零售品牌打造具有高情感智慧語言能力的客服助理,主要幫助企業向其使用者提供契合品牌調性和個性化需求的客服服務,目前已與餐飲、健身、沙龍等行業多家頭部企業達成深度合作。
銷售和營銷作為企業開源的重要入口,企業利用最新技術提高獲客效率的意願也非常高。美國的人工智慧初創公司11x,打造AI驅動的“數字工作者”以取代傳統的銷售團隊,其Agent能夠自主執行GTM工作流程。11x不透過軟體幫助企業降本增效,而是直接提供實在的工作成果,數字員工能夠自主實現完成的收入閉環。11x成立6個月就達到了200萬美金的ARR,目前ARR已經達到了1,000萬美金。FlashIntel正在打造AI驅動的GTM平臺並向企業提供AI驅動的銷售助理(SDR)。FlashIntel在G2 2024冬季報告中總計獲得了189枚徽章,其中FlashRev被評為最佳銷售產品,最佳營銷和數字廣告產品,以及最高滿意度產品。
② 在數字化滲透率低的傳統行業有隱藏的“金礦”
曾經,傳統行業的玩家對AI嗤之以鼻,過高的投入成本和微不足道的效果,讓他們難以對AI押注過多。
不過這一次,傳統行業的生成式AI之路,有可能跳過軟體階段,直接進入AI階段,類似新興市場從使用現金直接轉向移動支付。
這些行業本身對於科技的採用速度較慢,生成式AI的出現帶來了直接交付結果而非交付軟體的模式,減少了前期投入成本、肉眼可見的提升了投資回報率,使得恐懼新技術的決策者更容易被說服。比如醫療領域的病例記錄、法律領域的案件報告生成、金融行業的合規風險篩查等等。
2024年12月,美國家政垂直軟體巨頭ServiceTitan上市,上市當天股價漲幅超過40%,在2024年上市公司中,該漲幅僅次於社交平臺Reddit和晶片公司Astera Labs兩家。
要知道,ServiceTitan 2012年成立,歷經12年發展,在僅拿下家政行業1%市場份額的情況下,其市值一度達到90億美元。由此可見,美國垂直行業,數字化滲透速率之低,垂直行業AI化的價值之高。ServiceTitan之成功,自然使我們關注到美國傳統行業的機會,數字化滲透率低的傳統行業。
美國初創公司Sameday為美國家庭服務行業(除蟲、HVAC、家庭維修等)提供AI銷售代理,透過自動化的語音客服接聽來電並安排服務預約,提高電話接聽率,從而提高轉換率,現在已經與ServiceTitan整合。Sameday的創始人曾在美國增長最快的家庭服務行頭部公司擔任CMO,擁有極深的行業認知和豐富的行業資源。2024年,Sameday的ARR預計將增長5倍以上,月度客戶留存率達98.5%。
建築行業的AI解決方案提供商Pantheon,能夠生成高精度且可編輯的 3D 建築模型,透過AI實現更快的設計迭代週期可以顯著降低專案成本。Pantheon AI不向建築師出售軟體許可證,而是直接向房地產開發商和業主出售其設計服務。2024年10月,Pantheon AI完成了由a16z領投的2500萬美金種子輪融資。
傳統行業以外,法律、金融、醫療行業積累了大量資料,為行業垂直基石模型訓練提供了豐富的燃料,且法律、金融、醫療行業價值高,但普遍在傳統軟體巨頭的壟斷下變化緩慢。即便垂直SaaS一定程度上取代了過時繁瑣的老系統,但總體的滲透率依然有限。以醫療行業為例,其行業規模高達4.3萬億美元,貢獻了約1/5的美國GDP。但在美國市值前100的上市軟體公司中,只有一家是服務醫療行業的軟體公司。
2024年,Evenup ARR預計將達到5000萬美金,最新一輪的投後估值達到了10億美金。Evenup 利用生成式AI幫助律師進行人身損害賠償(Personal Injury Claims)案件的索賠工作。雖然目前只服務於人身損害賠償這一個領域,但這已經是一個非常大的市場了。美國每年約有30萬參與處理人身損害賠償的律師,每年支付給受害者的索賠金額高達1000億美金。
有備而來者,率先享受紅利,那些垂直行業專家、對行業的工作流有深入認知的創業者,結合不斷進化的生成式AI基礎設施,有機會迅速搶佔使用者,構建自身的行業資料壁壘。
③ AI不再按席位收費 :“Sell work, not software”
Menlo Ventures的調查資料顯示,企業在進行生成式AI產品採購決策時,第一考慮要素是產品是否具有簡單可測量的投資回報率,其次是產品是否根據實際應用場景定製。
值得注意的是,現階段,產品價格反而是最不重要的影響因素,僅1%的企業決策者聲稱產品價格影響採購決策。

資料來源:Menlo Ventures
結果正在變得更為重要。隨著AI的獨立工作能力提升,其工作結果、創造的價值會更容易被量化,企業對AI產品的價值評估,也會根據其工作成果界定,美國投資機構a16z提出。因此,商業模式變得更加重要。
SaaS時代,SaaS公司創新了按席位收費的商業模式,即按照使用SaaS產品的員工賬號數量按月或按年收取訂閱費用,這種定價方式背後的邏輯是,使用SaaS產品的每位員工,效率會有不同程度的提升、處理更多工作,許多SaaS定價的策略在於評估使用者效率提升創造的收益。
但到了生成式AI時代,這個SaaS時代一直以來賴以生存的邏輯正在被顛覆。隨著Copilot產品向Agent產品的升級,未來的Agentic AI系統將在不同AI agents的相互配合下,自動完成任務,取代越來越多的工作者,顯然,如果繼續按照席位收費,開發者的收入則會逐漸減少。
Benchmark合夥人最先建議生成式AI公司“Sell work, not software”,即按照工作成果收費,打破按席位收費的模式。
基於此,目前原生AI公司普遍採取的商業模式分為兩類,一類是基於用量的定價模式,Salesforce釋出的Agent force智慧體系統,提供客服、銷售、員工服務等AI agent智慧體,按照使用者與agent實際互動的用量收費,每次”對話“收費2美元,如果發生以下三種情況之一,即視為一次”對話“結束—— AI agent無法滿足使用者需求,需要人工介入;使用者主動結束與AI agent對話;使用者超過24小時沒有再主動與AI agent對話。
另一類是基於工作結果的定價模式,前Salesforce聯席CEO Bret Taylor創立的AI客服公司Sierra,為客戶提供基於工作結果收費的客服AI agent,從消費者滿意度、問題解決程度、以及每次的互動成本三方面來評估工作結果,決定企業付費規模。採用按照工作結果定價的模式,實現了AI agent企業客戶與開發公司的利益一致性,雙方將共同得益於agent獨立任務完成能力的提升。
趨勢二:等待一個“殺手級”AI消費級應用
“2025年(AI應用)下一個大事件屬於消費。”美國紅杉資本合夥人Jess Lee表示,AI聊天、圖片、影片已驗證了其消費市場潛力,接下來將看到全新的AI消費社交APP、新形式的互動媒體、基於聊天的遊戲、新的搜尋和資訊整合工具、基於互動式UI的聊天工具等。”
消費賽道,一直是歷次技術創新浪潮下創業者和投資人高度關注的方向,如果回顧之前的技術週期會發現,全球市值Top15的科技公司中,有9家是從To C消費產品起家的。To C的公司上市時,估值超過100億美元的比例,比To B公司高10%左右。
但在這一波生成式AI創業浪潮中,消費AI應用似乎在被創業者和資本遺忘。2024年,90%以上的A輪融資流向AI企業應用。
不過,自2024年下半年以來,這個現象正在發生改變。
2024下半年以來,資本市場對消費級AI應用的關注度上升,以矽谷孵化器Y Combinator 為例,其下半年孵化的消費級AI產品數量比上半年翻番。

資料來源:Y Combinator, UpHonest Capital整理
2025年,消費級AI應用的“土地”正在被開墾,行業在等待一個“殺手級”AI消費的應用。風險投資機構也對消費級AI應用的機會產生共識。YC Partner Michael Seibel表示,目前太多創始人尋找B2B的AI機會,太少人探索消費側的機會,消費創業者的機會來了;a16z提出“生成式AI或將重塑從旅遊、心理治療到網購等一切(消費行為)。“前Index Ventures合夥人Rex Woodbury,稱現在是“消費復興”的機會。
生成式AI對消費端改變,體現在三個層面:首先,AI會逐漸改變人與人、人與資訊互動的方式,形成新的流量入口;其次,AI搜尋正在改變資訊的分發方式,會創造新的商業機會;第三,AI釋放PGC、UGC內容創作潛力,使內容消費更加豐富多元。
以AI搜尋為例,作為線上流量的第一入口,已經久無戰事,生成式AI引入了新變數。2020年創立的生成式AI搜尋初創You.com,近期完成5000萬美元融資,價值7億美元了。OpenAI在7月釋出AI搜尋工具SearchGPT,其付費使用者均可使用。
Perplexity是一家成立於2022年8月的美國AI創業公司,公司由前OpenAI研究科學家Aravind Srinivas和前Meta研究科學家Denis Yarats等聯合創立,專注於開發基於人工智慧的對話式搜尋引擎,旨在透過大型語言模型(如GPT-4和LLama2)為使用者提供精準的搜尋結果。Perplexity的介面更像是聊天螢幕,使用者可以透過自然語言提問,Perplexity會提供直接的答案,並附上詳細的引用來源,Perplexity 的使用者增長非常迅速。2023年2月,Perplexity的月訪問量達到1000萬,獨立訪客達到200萬人。截至2024年4月,Perplexity 的月活躍使用者數便突破了1500萬。Perplexity在短時間內完成了多輪融資。截至2024年11月,Perplexity在新一輪融資中籌集了5億美元,使公司估值達到90億美元。投資方包括軟銀、亞馬遜創始人貝索斯和英偉達等多家知名企業和AI領域知名人士。
除了通用搜索引擎,生成式AI使垂直領域的搜尋引擎更普遍,瓜分通用搜索引擎的注意力。例如,垂直於企業知識資料庫的搜尋——Glean在9月份完成新一輪融資,估值達到46億美元,旨在最佳化企業內部資料檢索和問題答覆,在近兩年中ARR翻倍增長;亞馬遜、沃爾瑪都在加強電商搜尋引擎建設,今年先發搜尋助手,再發Agent。初創企業DayDream種子輪拿到了5000萬美元投資,Forerunner、Index聯合領投。DayDream連結了超過2000+品牌,支援自然語言檢索,根據使用者提供的時間、地點、場合等資訊給予相關產品推薦。Encore,YC24新一期孵化專案,是一個LLM驅動的針對二手商品購物的搜尋引擎,連結美國多個二手商品網站,支援自然語言搜尋以及按照主題的搜尋;垂直於科研場景的搜尋:初創企業Consensus與Perplexity有共同的投資人Nat Friedman和Daniel Gross,專注打造服務科研的搜尋引擎,改變人們獲取和使用學術文獻的方式。2024年收入增長了600%,月活40萬用戶,ARR近200萬美元。
也許明年會出現更多令人眼前一亮的垂直領域的AI搜尋創新。
這一點,美國紅杉在2025年的AI趨勢預測中也分享了一些思考,紅杉提出AI搜尋或將成為2025年的”殺手級“應用,他們提出了兩點預測:目前一個整體的搜尋市場可能會碎片化,未來每個人可能會有專業AI搜尋引擎——例如,Perplexity可能會成為投資人和分析師的第一搜索工具選擇,律師選擇Harvey,醫生選擇OpenEvidence……全新的生成式AI搜尋引擎將緊密契合目標使用者的“心智模式”,投資人、律師、醫生的思維模式各不相同,資訊獲取模式、目的和決策思維各有差異,這些不同和差異就是生成式AI搜尋引擎創新的機會;消費級和企業級應用場景分化,每位知識工作者每天至少會使用兩款AI搜尋引擎 —— 一款用於工作,另一款用於其他所有事務。
除了AI搜尋,落到電商、音樂、社交、遊戲、旅行和教育等直接To C的領域中,也各有生成式AI原生應用的創新機會。
以旅行為例,Wanderboat是面向消費者的AI旅行規劃工具,也是旅遊內容分享社群。它構建了一個chatbot,可以根據使用者需求推薦、定製目的地及各類娛樂體驗活動,還可以主動學習使用者的興趣,定製專屬行程。基於創始人此前在微軟的經驗,構建了一些很有趣的小工具,比如使用者在檢視地圖時也可以與AI互動,即時獲取一些資訊和建議。在零付費推廣的情況下,月活使用者數量達到了6位數。
一是多模態AI營銷,從文字延展到音訊、影片。形式從單點的chatbot延展到具有操作執行能力的agent,並且準確率和對於邊緣案例的覆蓋力隨著基石模型推理能力的提升增強。此外,如果生成式AI運用得當,銷售、營銷、客服對消費者的洞察進一步提高,可以創造更加個性化的服務、定製化體驗。
GigaML是YC孵化的一家AI客服初創,雖然這個方向競爭激勵,但實際GenAI應用的滲透率還比較低,因為客服在實際工作中有許多邊緣案例,現在大部分的GenAI應用解決邊緣案例的表現一般,原有的自動化客服足以解決基礎問題,所以企業升級的動力不足。GigaML發現將基石模型切換至o1-preview,加上大量的評估、調優之後,錯誤率大幅下降,從70%降至5%,並能夠解決8成的邊緣案例。在OpenAI最新推理模型加持下,客服用例值得期待。
Para和HeyGen分別是聲音和影片營銷的典型案例,Para利用AI生成個性化定製的聲音營銷電話,幫助品牌啟用使用者,幫助球隊活躍粉絲;HeyGen的AI影片營銷收入快速增長,據悉今年的年化ARR超過2000萬美元,估值已達到5億美元。
AdsGency則是一個利用AI使用者資料洞察,實現精準廣告營銷的公司,創始人此前曾在滴滴、亞馬遜從事廣告、營銷相關的產品工作。它的業務核心是廣告和使用者資料,為客戶提供了一個全棧AI營銷工具,覆蓋內容創意、創作、投放、歸因等流程。AdsGency也代表了現在AI營銷的一個發展趨勢—— 從Point Solution,到整個GTM的全流程自動化解決方案。
趨勢三:企業應用大模型朝模組化方向發展
2024年,人工智慧領域的一個顯著趨勢是模型的可組合性和模組化發展,這種模組化實現了從概念到規模化地落地。企業不再僅依賴於單一的“大模型”解決方案,而是可以根據具體需求,將不同的模組進行組合,定製出符合自己業務需求的能力。這種靈活性不僅能夠提升效率,還能降低成本,並且更好地滿足各行業對AI應用的多樣化需求。
在技術架構層面,傳統“大一統”的大模型被逐步拆解為功能與場景模組,例如Amazon Bedrock提供了一系列生成AI的模組化服務,涵蓋文字生成、影像生成、語音合成等功能,這些模組化的服務可以幫助企業根據自己的需求進行定製,支援跨行業的AI應用,如生成個性化的營銷文案、產品推薦和自動化客服對話等服務。微軟推出了更加精細化的模組化API,支援更加多樣化的場景,例如多語言客服、智慧會議助手和自動化客戶反饋系統。Transformer論文八位作者之一Aidan Gomez也瞄準這一方向,估值55億美元的Cohere提供專為企業用例最佳化的系列AI模型,在語言生成、多語言處理、多模態、語義檢索等方面各有所長,企業按需選擇、組合。
2025年,模組化和抽象化設計將在多個領域得到廣泛應用,特別是在人工智慧和機器學習領域。這種設計方式將推動AI系統的高效演化和自適應能力,為AI技術的廣泛應用提供更強大的支援。根據Gartner預測,到2028年,至少15%的日常工作決策將透過代理AI自主做出。
這種趨勢表明,模組化和抽象化設計將為AI系統的自主決策提供更強大的支援,推動AI技術的廣泛應用。並且,更多的技術企業將推出專為行業需求定製的AI模組。例如,針對智慧製造、智慧醫療、自動駕駛等領域的具體需求,可能會出現更加精細化的模組組合,企業可根據自己的資料和業務需求靈活選擇。而且隨著硬體能力的提升,這些模組可能會更加高效,甚至實現更高的跨領域協同能力。總之,這種模組化大模型的發展將向縱深推進,技術、商業與社會的多重博弈將重塑行業格局。
#05
總結
這場科技商業史上最大“賭局”,讓身處其中的投資者越來越感受到了曾經矽谷早期的投資氛圍——押注一個未知的全新技術、等待一個超長回報週期,而不是基於網際網路成熟技術的模式創新上迅速迭代和回血。
自從ChatGPT釋出之後,矽谷正在吸引全球的目光。關注矽谷發生的故事,正在成為眾多的中國投資者甚至中國企業員工、公關必做的事,大家試圖從這些持續關注中獲得最前沿的資訊和生成式AI最前線所發生的故事,從而試圖判斷新的商業方向。
誰也不知道這場生成式AI的變革會將商業引向何方,也同樣預測不到新技術的迭代如此之快。
在過去的幾年裡,聽到最多的便是企業對生成式AI的抱怨“我們知道它重要,但我們仍然不知道如何用在自己的場景中”,這種抱怨帶著一些敬畏——“不上大模型一定會被淘汰”。投資者在不斷推高的估值和融資中,快要喪失信心。動輒幾十億美金的融資,再加上Scaling Law之下,不斷增加的資料中心的投資,讓他們望而卻步。這也表明,2025年將是生成式AI讓人們看到賺錢希望的一年,投資者和創業者同樣需要信心。
AI Agent元年,這個發端於學術界的概念將會落到實際,併產生價值,企業將會使得生成式AI變得更加好用,並切實轉化為價值。與此同時,消費級的AI應用將會讓人們切實感受到生成式AI帶來的生活的變化。
垂直領域的模型正在成為通用大模型的補充,讓更多企業釋放AI的價值。垂直行業中,將會出現越來越多的AI搜尋應用,滿足人們不同領域的需求。
2025年,從生成式AI來說,一些泡沫會破滅,一些企業能夠從中賺到錢。技術新陳代謝快速而殘酷,這場競爭中沒有老手,都是新人,昔日的領軍者亦有可能跌落神壇,最先關注到技術和商業的變化,並做出行動的企業,才能在這場競爭中生存下來。
*【免責宣告】本篇內容並非投資意見,為便於理解,該報告彙總了相關領域的典型企業案例作為參考,但所含相關公司資料不構成任何投資產品之要約或者建議,只作為一般參考資料用途。
文末互動:
你對這份報告的哪個部分最有興趣?
評論區告訴我們你的看法哦~
別忘了點關注,不迷路啊。
👇👇👇


Get Rich


點贊+在看,搞錢穩賺!