打造「無所不能、無處不在」的AI,百度為何要從「作業系統」做起?

聰明又能幹的超級生產力。

作者|Cynthia 


編輯|鄭玄

大模型能梳理出中國上下五千年都發生了什麼,卻回答不了現在幾點;能解釋清楚什麼叫量子力學,但卻連做一個圖文並茂的專業級 PPT 都很難辦到。
為什麼大模型看似無所不能,但實際用起來卻總是差點意思?
原因很簡單,聰明、博學不等於能幹活。
聰明,需要大模型透過海量的知識訓練與學習,練出了發達的大腦,可以很好的回答一個問題;
而同時滿足聰明、能幹兩個要素,則需要給這個聰明的大腦,配上靈活四肢,實現「深度思考+深度交付」。
也是因此,如何推動大模型從聰明的思考,到實現「聰明又能幹」的進化,成為了決定這輪大模型熱潮究竟是曇花一現,還是改變歷史的勝負手。
百度給出了打樣。
4 月 25 日,在 Create 2025 百度 AI 開發者大會上,百度創始人李彥宏帶來百度文庫、百度網盤聯合推出的全球首個內容領域的作業系統——滄舟 OS。
其透過充分融通百度文庫和網盤過去積累的底層技術、能力、資料,可以像水一樣,融通在不同場景裡面,以最合理的形式、使用者最便捷的互動介面,實現低門檻、和端到端的高質量交付。
依託於滄舟 OS,百度文庫、百度網盤對 AI 的願景和期待,就是在任何時候、任何地方,任何終端裝置上,實現真正的一站式、端到端的交付,讓 AI 做到「無所不能、無處不在」。
01
滄舟 OS,讓 AI 向作業系統級進化
在科技產業有這樣一個共識,任何技術從實驗室到真正走向千家萬戶,都需要經歷一個漫長的 Gartner 曲線歷程。
在這條曲線中,第一階段的增長,主要取決於技術進步帶來的市場狂熱預期,但隨著技術的落地效果不理想,這一階段的增長會快速進入衰退,直至技術落地所需的條件逐漸成熟,並被具象成幾乎零門檻、無所不能、無處不在的基礎設施,第二階段的生態爆發便會隨之到來。
軟體產業第二階段開啟的標誌之一,通常就是一個成熟作業系統的出現,比如 Windows 之於電腦產業,iOS 之於手機產業
那麼如何定義一個成熟的作業系統?在大約 15 年前,全球的科技產業,有過這樣一個爭論:同樣是能觸屏操作、大屏手機、能打電話、能拍照、能聽音樂、發簡訊,為什麼蘋果或者說智慧手機與過去的功能機會是兩個物種。
核心原因之一是,iOS 繼承了來自 MAC OS 的核心級穩定性和多工能力,並將其做成了一個開放生態,開發者們可以任意整合這些蘋果的底層能力,做出自己的創新應用。這也讓如何定義一個手機,從摩托羅拉、諾基亞一兩家巨頭的事,變成了整個生態一起參與,無限可能的龐大產業,自此拉開了此後十多年的移動網際網路的大門
技術會滾滾向前,但商業故事的劇情總是會踏著相似節拍不斷重複演繹,在手機 OS 中被驗證過的底層邏輯,在大模型時代的 OS 構建上,依然通用。
總結來說有三:完整的底層能力、靈活的中樞排程、繁榮的應用服務生態。正好對應滄舟 OS 的三層架構:底座基建、中樞系統與應用服務。唯一的不同是,應用與中樞、底座中間的橋樑,從以往的 API,換成了更加標準化、低門檻的 MCP。
其中,MCP Server 部分的底座基建,它的核心元件是 Chatfile plus,主要作用是透過知識化框架,對不同模態、不同形態、不同格式的內容做元素級的拆解和解析處理,以及多模理解、多模檢索、檔案轉碼解析等一系列工具框架元件。
同時,百度文庫和網盤構建了公域知識庫、私域知識庫、記憶庫「三大庫」,具體指的是百度文庫多年累積的公域知識資料(公域知識庫)、網盤的使用者授權使用的知識資料(私域知識庫)、使用者過往在文庫或網盤操作的指令、使用習慣和歷史生成記錄(記憶庫)。
這些資料往往以不同模態、不同形態、不同格式呈現。其中,公域知識庫提供通用的知識,私域知識庫、記憶庫則儲存使用者的個性化資料。
知識化框架中,滄舟 OS 將對「三大庫」中的多模態內容進行向量化、標籤化的處理,也就是將圖片、文字、影片、音訊、文件等非結構化資料,透過不同專業模型將其轉化為計算機可以讀懂的多維向量資料,也就是一組 token。
而在中樞系統上,百度文庫和網盤自研了「三大器」,也就是融合編輯器(對應文件、PPT 等內容的編輯)、閱讀器(文件與 PPT 等內容的閱讀)、播放器(音影片播放)等工具。
同時,滄舟 OS 還可以透過「排程中樞」,透過互動元件、意圖模型和傳輸基建等,結合使用者記憶和畫像資料,透過模型理解使用者意圖,高效分配排程 Agent。
最頂層,則是一系列 AI Agent。「滄舟 OS」整合文庫、網盤的 PPT、AI 繪本、AI 思維導圖、AI 海報、AI 筆記、AI 掃描、AI 聽記等數百項 AI Agent,生成模態涵蓋了圖、文、影、音等各種型別、全面覆蓋學習辦公、生活娛樂等場景,並依託於融合編輯器的編輯、修改、精細調控能力,進而讓檢索和內容生成的質量更高、更符合實際的個性化任務需求。
02
在滄舟 OS 上,
打造更多「聰明又能幹」的 Agent
圍繞最頂層的應用服務,百度文庫 & 百度網盤既推出了數億使用者驗證過的好用的數百項 AI Agent,同時也接入了大量第三方的專業 Agent 做大應用生態。
作為「一站式 AI 內容獲取和創作平臺」,百度文庫的付費使用者已超 4000 萬,AI 月活使用者達 9700 萬。百度網盤也升級為「一站式內容服務平臺」,服務超 10 億使用者,使用空間總和超過 1000 億 GB,AI 月活使用者超 8000 萬。百度文庫、百度網盤已成為大模型時代真正的「超級生產力」。
在大會上,百度文庫和百度網盤還展示了基於「滄舟 OS」開發的全新能力:「GenFlow 超能搭子」和「AI 筆記」。
GenFlow 超能搭子是百度文庫 APP 推出的多智慧體協作能力,有了「滄舟 OS」的加持,內容生成可以做到多工並行,還能基於最全面專業的聯網資訊、使用者自己的習慣和偏好來完成各項任務交付。
比如使用者想要做一個婚禮策劃,但是前期的輸入只有一句簡單的:我想五一在海南辦一場戶外婚禮,幫我做策劃案與邀請函。
需求看似簡單,只要對著歷史模板完形填空就能搞定。但要做到使用者滿意,就需要知道使用者的審美偏好、預算期望、流程偏好,還需要知道五一期間海南的天氣、人流量、場地分佈,在此之後還需要將這些圖文與知識透過 PPT 工具進行組合,生成一個完整的方案,最後基於方案以及使用者審美偏好,生成一張完整的婚禮請柬海報。
而要完成以上內容,需要分別排程使用者的歷史聊天記錄、歷史瀏覽記錄,以及意圖識別、全網搜尋、PPT 工具,分析使用者意圖,瞭解使用者偏好,自由組合工具,最終才給出使用者非常具體的包含流程、日期、場地、預算、主題、執行細節、風格、人員安排在內的完整策劃案。
與此同時,使用者需要的策劃案與海報是互相搭配的,這也就需要兩者的所有資訊保持一致,用同一套作業系統並行輸出。
當然,AI 一定沒辦法一次生成讓所有人滿意的成果,這就需要無論是婚禮策劃案還是海報都需要具備可編輯能力,而支撐這一能力的,則是「滄舟 OS」的融合編輯器能力。
不難發現,從深度思考到深度交付,GenFlow 超能搭子幾乎是市面上唯一一個真正的「多智慧體協作」類產品的現貨。不僅解決了多智慧體協作類產品成本高、生成時間長、效率低、無法穩定交付、無法多輪對話調優的通病,更是直接內嵌到成熟產品與使用者授權的私有資料結合,讓 AI 真正有機會實現「無所不能、無處不在」的目標。
百度網盤的 AI 筆記,則是無數辦公黨、考研考公黨的得力干將。
AI 筆記是業內第一個多模態 AI 筆記, 可以將使用者在百度網盤儲存的各種考研學習影片和筆記頁面巢狀在同一個介面,實現絲滑聯動,且影片內容和筆記互相強關聯,從看影片,到生成 AI 筆記,到總結 AI 腦圖再到最後的 AI 出題檢驗學習成果,完整覆蓋使用者學習的全週期。
舉個例子,英語考研太難成為了前段時間的熱門話題,使用者想要針對考研英語做集中的複習。AI 筆記會先對使用者網盤中儲存的相關資料進行檢索,同時查詢網上公開資料給出的考點,對其進行整理。但整個過程並沒有停留於此,AI 筆記還會結合歷年真題,對自己生成的考點進行最終校驗,只有經過校驗的考點,才能在此基礎上繼續生成思維導圖、考題預測,幫助使用者加速學習進度。
而在這過程中,涉及的工具呼叫,並不比做婚禮策劃更少。比如,找考點、找真題需要全網檢索能力,而真題往往以 PDF 甚至圖片的格式呈現,名師解讀則以影片形式呈現,這就需要多模態內容的解析能力。最終的思維導圖生成與考題預測,則需要大模型的推理能力、多模態內容生成能力,以及與不同內容之間的對映關聯的能力,同時還需要保證內容生成的絕對準確性。
這背後,就是「滄舟 OS」的賦能。
當然,百度支援開發者全面擁抱 MCP,所以滄舟 OS 不只服務於百度的內部生態,作業系統發展壯大最重要的一環是對外開放,激發廣大開發者的創新能力。
所以,為了讓生態和應用發揮最大價值,百度文庫、百度網盤基於「滄舟 OS」,率先將 MCP 充分運用到產品與生態的連結上,構建 MCP Server-Client-Host 三層體系,將文庫、網盤的能力透過 MCP Server 形式開放,透過 MCP Client SDK,方便更多企業使用者、開發者、智慧體應用等 MCP Host 接入。
其中,最有代表性的案例當屬三星手機。三星手機正在接入百度文庫網盤的檔案上傳、下載、檢索、分享和內容理解等多個 MCP server。
一方面,使用者在手機的語音助手介面,透過說話方式,就可以直接實現檔案的上傳網盤備份、雲上分享、文件摘要總結和內容問答等功能。
另一方面,這些 server 還能夠豐富三星手機系統的雲端儲存能力,解決手機自身對大檔案、多檔案難以批次備份和分享的問題。
比如使用者在手機相簿裡,喚起語音助手說:「把昨天在奧森拍的照片備份至百度網盤,並把小明的照片傳送給他」。相關照片就會被上傳到使用者授權的網盤賬號內,並生成分享連結,手機助手再呼叫通訊錄,把這個連結透過簡訊方式發到對方手機上,只要點選連結,使用者就能直接進入百度網盤檢視或轉存。
毫無疑問,檢驗 OS 底層能力是否可靠,並不在於工具的堆砌,或者黑科技的多少。頂層應用服務生態是否好用、成熟與豐富,是 OS 能力的最佳檢驗標準。
03
OS 的故事沒有終點
在資本市場,最被投資者認可的一種企業型別,叫「時間的朋友」。
所謂時間的朋友,就是當企業做對了一件事情之後,接下來只需要繼續做下去,那麼業績就會維持永動機式增長,生態開發者也能持續受益。
而作業系統,就是這樣一個典型的永動機式市場。只要電腦、手機的市場還依然存在,那麼屬於微軟、蘋果、谷歌們的作業系統的故事就沒有終點。
大模型也是同理。當「深度思考+深度交付+公私資料+MCP 生態」集合在一起,未來成為新時代無所不能、無處不在的 AI,那麼,類似寒武紀的新物種大爆發就將源源不斷的產生。
在這個過程中,向下看,是百度文庫、百度網盤等對自身能力的開放。透過積極擁抱生態,成為大模型新物種的創造者和新規則的制定者。
向上看,則是無數新的 Agent 基於「滄舟 OS」而被創造出來、被看到,構成磅礴噴湧的新應用服務生態。
而當下,所有故事,才剛剛開始。
*頭圖來源:百度
本文為極客公園原創文章,轉載請聯絡極客君微信 geekparkGO
極客一問
你如何看待百度滄舟 OS 作業系統

熱點影片

王興興收藏夾第一的影片,諾貝爾獎獲得者費曼:不要被他人的期待束縛。
點贊關注極客公園影片號
觀看更多精彩影片

更多閱讀


相關文章