

給企業落地大模型打造基礎設施。
隨著大模型迭代加速,AI 應用生態正面臨前所未有的壓力:越來越多的垂類應用被更強、更通用的模型 “吞噬”。開發者的焦慮感在加劇,企業也開始重新評估開發 AI 應用的投入產出比。
4 月 25 日在武漢舉辦的 Create 2025 百度 AI 開發者大會上,百度創始人李彥宏回應了這股 “模型焦慮”:大模型快速迭代不會吞掉所有 AI 應用,“只要找對場景,選對基礎模型,有時候還要學一點調模型的方法,在此基礎上做出來的應用不會過時。”
李彥宏展示了百度智慧雲在交通訊控、鋼鐵行業中的 AI 應用案例,稱通用大模型再怎麼升級,也不能獨立完成 “檢測高速公路上各種安全事件” 或者 “檢測熱軋帶鋼表面的缺陷” 等精細任務,它們與小模型協同才能產生更好的解決方案。
他認為,大模型能力提升會讓這些 AI 應用護城河更深、價值更高,“這樣的機會,在千行百業裡比比皆是”。市場調研機構 Gartner 估算,到 2029 年,中國 60% 的企業將把 AI 融入主要產品和服務,而這些 AI 功能也會成為企業收入增長的主要動力。
幫企業客戶開發大模型應用,是百度智慧雲近年來收入增長的動力。2024 年,百度智慧雲收入達到 219 億元人民幣,同比增長 17 %,是百度增速最快的業務線。據統計,今年一季度,百度智慧雲繼續位居國內的大模型中標專案數量和金額第一。
2023 年開始內測的千帆,是百度智慧雲推動大模型落地企業的核心產品。這次 AI 開發者大會上,百度智慧雲再次升級千帆大模型平臺:
模型開發平臺更加多維開放,支援上百個模型服務;新增多模態、深度思考模型工具鏈,並且成為國內首個把 RFT、GRPO 等領先強化學習方法產品化的平臺;“一鍵蒸餾” 功能,讓企業客戶更方便地用小引數模型 “學” 到大引數模型,解決特定問題的推理能力,降低推理成本。
資料智慧平臺上線,讓企業把原來散落在各個部門、流程中的資料統一管理和治理,挖掘資料價值,實現資料變現,以及提升業務決策效率。
應用開發平臺增加 “智慧體 Pro”,讓企業客戶可以批次開發嵌入到工作場景中的大模型應用,尤其是當前行業中的熱門產品形態 Agent,讓各行各業定製自己的企業專屬智慧體;釋出完整的 MCP(Model Context Protocol)服務,支援客戶和開發者將 MCP Server 接入大模型應用,推出低程式碼建立 MCP Server 的工具,提供免費託管服務,以及組建聚集上千個 MCP Server 的廣場。
MCP 是 Anthropic 在 2024 年提出的協議,用統一的方式,把現有軟體變成大模型可以直接呼叫的 “工具”。“MCP 讓 AI 更懂外部世界,更容易獲得資訊,更自由地呼叫工具,是 AI 發展的一大步。” 李彥宏說,“現在基於 MCP 開發 Agent ,就像 2010 年開發移動 App。”
百度各業務線也全面支援 MCP,將搜尋、地圖、文庫、電商、網盤等產品能力做成 MCP Server。企業和開發者在千帆平臺中可以把它們接入自己的 Agent。
2023 年 3 月,百度在國內率先發布對標 ChatGPT 的文心一言,並推動公司全面向大模型轉型。如今,百度正進一步整合內部資源,抓住企業落地大模型的機會。雲平臺間的大模型企業服務競爭,已從單點技術比拼走向體系化能力角逐。
三個平臺,覆蓋企業落地大模型的不同環節
兩年迭代,百度智慧雲逐步認識到如何開發一款好的企業大模型開發平臺:“門檻要足夠低,低到人人可用;天花板要足夠高,必須有能力服務那些最嚴肅、要求最苛刻的企業場景。”
這是百度智慧雲千帆平臺的升級目標。“大家有可能用的是同樣的基礎模型,要做出差異化的體驗,靠的是工程能力。” 百度集團執行副總裁、百度智慧雲事業群總裁沈抖說,企業可以利用千帆 “快速完成從資料處理到模型定製、應用開發的一整套工作,開發出效果更好的產品。”
模型開發平臺已上線超過 100 款基礎模型,涵蓋百度新發布的原生多模態模型文心 4.5 Turbo、深度思考模型文心 X1 Turbo,以及 DeepSeek、阿里等公司開源模型,跨越原生多模態、文字生成、深度推理、影像 / 影片生成、語音大模型等方向。企業客戶可透過 API 呼叫這些模型。
這只是千帆的基礎能力。他們還開發了模型工具鏈,覆蓋資料管理、模型精調、評估最佳化與部署。“雖然從 0 到 1 訓練大模型的需求沒有那麼多了,但企業定製專、精模型的需求還在增長。” 沈抖說。
更新後的模型開發平臺上,企業可以拿自己收集的資料集精調平臺上的基礎模型,讓它更好地解決特定場景的問題,也可以用新上線的 “蒸餾” 功能,把大尺寸模型解決特定任務的能力遷移到小模型上。

蒸餾並不是一個全新的功能。百度智慧雲 AI 與大模型平臺總經理忻舟說,在 DeepSeek 推出 R1 前,千帆就可以支援企業用蒸餾的方式開發模型,“一直在做”,R1 加深市場認知,也驗證了千帆的判斷,加上公司內部業務有需求,蒸餾的價值提升,就推出了 “模型蒸餾樣板間標品化產品”。
比如智聯招聘使用千帆模型開發平臺的模型蒸餾功能,把 6000 多億引數的 DeepSeek-R1 作為 “教師模型”,蒸餾出它回答 “人崗匹配” 問題的資料集,清理後用它精調百億引數的 ERNIE Speed 模型,保留效果的同時,將模型使用成本壓縮至原來的三成。
忻舟說,這個平臺也是一個可以迭代的模型開發體系。很多的 C 端使用者使用大模型,不能為廠商提供直接有效的資料,促進基礎大模型能力的提升,這個在行業已經形成共識。比如 DeepSeek 釋出 R1 前並沒有積累太多的使用者。
不過企業真實應用場景上,呼叫大模型解決的都是特定場景問題,所以模型使用反饋對模型的價值都非常大。“千帆模型開發平臺可以幫企業利用這些有效反饋,做模型精調並持續改善模型效果,讓企業的應用效果越來越好。” 他說。
他們給模型開發平臺設計了多種使用模式,以相容不同的使用者。針對開發能力強的企業和開發者,他們提供整合介面,支援本地、雲端 IDE,或者命令列使用,併兼容 Python、Go、JS、Java 等多種程式語言。為了進一步降低門檻,他們會提供精調好的行業模型或者提供模型 “樣板間”。
企業推動大模型落地的過程中,開發應用是最耗時的環節。百度智慧雲應用平臺部總經理朱廣翔說,他們調研發現,許多企業將 90% 的 AI 專案時間花在了應用開發上。
尤其是 DeepSeek-R1、文心 X1 等深度思考模型出現,讓 Agent 解決複雜問題的能力增強,但開發難度也跟著上升。
在開發者大會上,沈抖用 “大工程” 形容 Agent 開發過程。他們調研發現,企業想要做好 Agent 要具備以下能力:
結合企業自己的私域資料、企業知識庫,讓 Agent 學習企業多年沉澱的行業經驗,理解業務場景。
準確匹配到企業的標準 SOP,能根據企業規範編排業務流程、執行任務。
呼叫各種工具,解決複雜問題;同時還得達到企業級服務要求的安全性、穩定性、可控性。

千帆應用開發平臺推出了智慧體 Pro,使用者只需要輸入提示詞,上傳需要呼叫的知識庫,選擇特定的元件,比如 Deep Research,就能迅速建立一個像行業內 Deep Research 應用那樣的 Agent。而且它不僅可以像其他的 Deep Research 那樣搜尋公開資料,也可以呼叫企業內部的資料庫,整合後生成報告。
企業和開發者過去常用 RAG(檢索增強生成)功能,讓大模型根據特定的知識庫回答問題,從而提高解題能力。隨著智慧體 Pro 推出,千帆也把它升級成 Agentic RAG。
朱廣翔舉例,銷售要去找遊樂園談合作,想用公司開發的 Agent 推薦方案,傳統的 RAG 會把關鍵詞做向量化,然後用這些特徵匹配知識庫,如果公司沒有跟遊樂園合作過,可能什麼都沒有;而 Agentic RAG 具備思考能力,它會先拆解使用者的需求,知識庫中沒有完全匹配項,它也會找相似的方案,然後整合出一個答案。

用智慧體 Pro 降低企業開發大模型應用門檻的同時,千帆也全面支援 MCP,提升 Agent 價值。朱廣翔說,百度智慧雲是第一家支援 MCP 的雲平臺,從 3 月到現在搭建起了一套完整的 MCP 服務,支援企業的 Agent 接入 MCP,還開發低程式碼製作 MCP Server 的工具,提供免費託管服務。
他們收集整理了行業內公開的優質 MCP Server,與百度開發的影像識別、OCR、語音識別、語音合成等 AI 工具,百度智慧雲長期積累的能源電力、智慧交通等垂直行業的工具,以及百度 AI 搜尋、地圖、電商、網盤、百科等核心業務聚集到一起,組建超過上千個 MCP Server 廣場。他說,利用這些 MCP 元件,企業可以不斷給 Agent 增加各種技能,讓它們持續成長,變成一個個行業專家。
與模型開發平臺類似,千帆的應用開發平臺也準備了 “樣板間”,降低企業的使用門檻。他們也把新功能與無程式碼開發工具 “秒噠” 打通,讓企業一站式開發 AI 產品。
資料智慧平臺是千帆新上線的服務。百度智慧雲資料平臺部總經理劉斌說,他們調查發現,企業訓練模型、開發應用的過程中,50~80% 時間都花在了在資料治理上。
尤其在多模態模型能力不斷增強的當下,企業同時面臨文字、影像、語音、影片等多模態資料的治理難題,而現有工具和流程仍以人工為主,協作複雜、自動化程度低,安全也難以保障。
“拉高的不只是機器和人力成本,還有機會成本,這對企業來說損失更大。” 劉斌說,企業用好大模型,資料工程是與算力、模型同樣重要的基礎設施,“但多模態資料治理還停留在農耕時代”。
據介紹,資料智慧平臺具備多模態資料管理、多模態資料處理、彈性 AI 計算、統一線上協同開發四項核心能力:5 大類運算元 100+,支援抽取、清洗、過濾、去重、嵌入等資料處理主要環節,覆蓋文件、影像、語音、音訊等所有模態,大部分場景下只需透過少量配置,就可完成資料處理;很好支援 GPU+CPU 的混合計算,強彈性可以用來高效處理不同規模的資料;跨團隊協作能力讓大規模開發變成可能。

這一平臺的首位客戶,正是百度自己。劉斌說,資料智慧平臺是百度內部長期使用的資料工具的產品化版本,支撐了文心 4.5 及其升級版 Turbo 的訓練,解決了資料冗餘、不一致、精細管理缺失等難題,讓資料生產效率提升六倍,算力成本節省 30%,而且 “資料安全可共享、可審計”。
在百度智慧雲看來,隨著大模型與 AI 原生應用加速滲透產業核心場景,企業在資料管理方面的需求會持續增長,資料工程也會越來越重要。“未來多模態的資料體量會有 10 倍以上增長空間。” 劉斌說,“這是政企客戶的剛需。”
雲平臺的大模型應用競爭,比拼的是體系能力
千帆的誕生和迭代,是百度全面轉型大模型的產物。
朱廣翔說,大模型浪潮到來後,百度的各個業務快速接入大模型,“開發了一大堆應用”,覆蓋問答、客服、創作、程式碼執行等各種場景,他們從中提煉不同團隊開發大模型應用或功能的共性,做出千帆應用開發平臺——模型開發平臺也是類似的過程。
把公司內部技術對外開放,是大型雲計算平臺開發產品的慣用邏輯。AWS 的第一款產品是亞馬遜電商網站的商品資料庫,火山引擎早期最成功的產品是位元組的推薦演算法服務。
在忻舟看來,基於公司內部的技術積累迅速推出新產品,“只是短期優勢”。傳統的企業客戶,業務流程相對穩定,沒有那麼容易接納新技術,“效果只是企業考慮的因素之一,他們同樣在意效能和成本”。
想抓住企業落地大模型的機會,雲平臺不僅要有各種型別的領先模型,還要理解企業的真實需求,並提供低成本的方案。
百度雲計算業務從 2015 年正式對外運營,後更名為 “百度智慧雲”,一直有著 AI 雲的鮮明標籤。據市場調研機構 IDC 統計,截至 2023 年,百度智慧雲在中國 AI 公有云市場的份額連續 5 年保持第一。
在此期間,百度智慧雲積累一批願意嘗試用 AI 技術改造業務的客戶,和 AI 在產業中落地的經驗。對於雲計算公司來說,客戶和服務經驗都是優質資產。一旦某個企業選定公有云服務商,都會在資料和業務層面深入繫結,遷移成本會持續升高。在新技術到來時,這些客戶往往會願意在原有的雲計算平臺上繼續探索。
百度智慧雲介紹,千帆已經服務超過 40 萬客戶,在央企滲透率超過 60%,精調了 4.5 萬個模型,開發了超 100 萬個應用。這幫助百度智慧雲更好地理解使用者需求,持續迭代千帆大模型平臺。
企業客戶在意的效能、成本,比拼的是雲平臺的技術系統實力。百度智慧雲在 2 月初上架 DeepSeek V3 和 R1 模型,API 呼叫價格比 DeepSeek 官方刊例價還低,當天就吸引 1.5 萬客戶使用。
“這不是大額補貼的結果。” 忻舟說,這是百度智慧雲在大模型推理效能最佳化方向的技術積累,他們聯合百度智慧雲異構計算平臺百舸、基礎架構部等團隊,針對 DeepSeek 的模型架構做了深入最佳化,比如將模型推理的 Prefill(處理提示詞)和 Decode(生成內容) 兩個階段分離,使其能在不同的 GPU 上並行處理,從而降低了算力成本。
這次 AI 開發者大會上,百度又為千帆大模型平臺增加更多能力,把公司各個業務開發的核心產品轉換成 MCP Server 大規模對外提供。這樣的開放程度,在全球大型公司中都很罕見,大多數公司支援 MCP 都只是為了利用生態增強實力。
“企業現在甚至可以用千帆,快速開發出類似 Perplexity 或 Manus 的產品。” 朱廣翔說,接下來千帆也會相容 Google 推出的 A2A 多智慧體協作協議,讓企業開發的 Agent 與全世界的 Agent 互動,提高產品價值。
資料智慧平臺則讓千帆體系變得更完整。據市場調研機構 Gartner 估算,到 2028 年,中國企業處理 AI 資料的投資將達到 2024 年的 20 倍。
“資料平臺有機會在更多場景發揮價值,推動企業的資料治理從農耕時代邁入工業時代。” 劉斌說,無論是模型能力的演進還是 Agent 應用的擴充套件,資料始終是基礎。
“我們其實不存在 ‘Stay on the table’ 的問題,因為我們十幾年前就已經上了 ‘table’。” 李彥宏在去年底的內部會上說,“百度絕不可能下這個 ‘table’。”
千帆的體系化升級,是百度給出的最新證明。
題圖來源:《人生切割術》
– FIN –
