支援多模型融合排程，升級全新語音大模型、圖片問答能力。

作者丨鄭佳美

編輯丨馬曉寧

剛剛無縫接入文心 4.5、文心 X1 和滿血版 DeepSeek-R1 的文小言，轉身又整出了新動作。

3 月 31 日，文小言迎來了一次全面升級，上新了多模型融合排程、全新語音大模型、圖片問答、拍題講解等多種新功能。

新功能聽起來很厲害，但實際使用效果又如何？不多贅述，AI 科技評論先替大家實測一波。

更強大的“大腦”

據透露，文小言目前已經集齊了市場上的最強模型，擁有了更強大的“大腦”。

這一點體現在了這次升級中的多模型融合排程功能上，而所謂的融合呼叫，其實就是在面對不同型別的問題時，文小言可以自己選擇能夠提供最優解的模型，從而保證使用者的使用體驗。

實測階段，我先是丟給了它幾張鸚鵡的圖片，並問它圖中鸚鵡的性別，這個問題對於我來說，難度不亞於“憑鳥腿斷品種”的難度，而文小言卻輕鬆回答，並且給出了判斷依據。之後我又讓資深養鳥發燒友也看了一遍，最終的答案和文小言給出的答案完全一致。

後續我又翻出來了兩張衣服吊牌的圖片給它，並讓它幫我分析一下圖中的衣服哪件的面料更適合徒步。緊接著的一連串的推理分析中，它不僅分析了面料的透氣性和耐磨性，甚至連吸水性都考慮了進去，有些暖心了。

除了分析衣服面料，我還把幾張護膚品的成分表扔給了文小言，讓它幫我挑一個適合敏感肌在春天使用的款式。我本以為它會把所有拗口的成分全都羅列出來分析一遍，沒想到它只是對每個產品的優缺點進行了展示分析，直接明瞭的對比了不同產品可能帶來的使用效果，最後給出了明確的對比結果。簡單直接又通俗易懂。

同理，我還用它測試了一下醬油的配料表，讓它幫我挑一個健康的醬油。不出所料，分析過程十分詳細，還把每種元素的多少所對應的適應人群給分析出來了，細節拿捏的很好。

測試到這，其實我就已經對文小言的“更強大腦”有了一些認同感，但又覺得這可能並不是極限，於是翻出了一張之前的驗血報告甩給它，讓它用大白話幫我分析一下報告中顯示的身體狀況，並給出一些後續的保養意見。不得不說，它最終給出的答案，確實是大白話，也確實挺準確。

除了擅長推理分析，文小言還能看圖識景，只需給它一張圖片，就能精準識別圖片中的景點，哪怕是隻有一條河亦或是一座山，都能被它“一眼看穿”。

更為複雜的人文風光也同樣不在話下，根據建築風格和自然景觀輕鬆識別出正確答案。

除此之外，我還上傳了一張英文選單，並命令文小言在有限的預算內，結合我的飲食習慣，幫我翻譯並規劃如何點菜。雖然最終的結果並沒有將中英文菜名一一對應展示，但給出的結果還是比較符合常理，如果真的在日常生活中使用到的話，屬於是比較好用的一個功能了。

文小言除了能化身集翻譯、預算控制為一體的點單神器外，在拍照解題方面也是一把好手，例如在解決一些簡單的數學問題上，也不再是列出冗長且較為晦澀的解題過程，而是直接亮出真人解題影片，簡單又直接。

更會說的“嘴巴”

當然，文小言這波升級，不僅有了更強大的“大腦”，還有了更會說的“嘴巴”，即更強大的語音大模型功能。實測下來，感覺文小言的語音功能反應速度很快，而且還是個“捧哏”選手，永遠不會讓話落在地上，感覺可以和豆包有一拼了。

測語音功能時，我用的還是第一個鸚鵡分公母的問題，這次我直接用語音問它，問題前腳剛問完，僅僅過了兩秒鐘，文小言就開始侃侃而談，而且還有很多語氣助詞，很貼合日常生活中人與人之間那種對話的感覺，而且問題解答得也很透徹，還支援互動交流，體感拉滿了屬於是。

除了答得快、答得好，文小言的語音互動甚至還支援用方言回答，雖然有些語調還稍微欠缺點“人味”，但整體聽起來並沒有那麼違和，方言這塊雖然讓我很驚喜，但是覺得還是有可以提升的空間。

語音這塊，還有一點讓我覺得很有意思的是，文小言竟然還是個“帶娃高手”，可以快速接收小使用者的需求並且迅速反應調整輸出的內容。例如，當給小朋友用文小言講故事，但它講的故事小朋友都表示聽過的時候，文小言還能快速反應，找到更多的故事講給小朋友聽，不給他留下一點哭鬧的機會，“帶娃高手”實錘。

整體來看，文小言的語音大模型還是非常亮眼的，這一切都要歸功於百度釋出的業界首個基於全新互相關注意力( Cross-Attention )端到端語音語言大模型，它在實現了超低時延的情況下也實現了超低的成本，在相關問答場景中，呼叫的成本比行業均值下降了50%-90%。

從目前的表現來看，百度在語言模型技術上已經取得了顯著的領先優勢，但更值得關注的是，百度的領先並不僅限於技術層面。事實上，它在應用生態和產業佈局上也展現出全面的優勢，這種多維度的突破正在重新定義行業競爭的格局。

更開放的精神

縱觀百度近期這一系列密集的動作，不難發現文小言只是其中的關鍵一環，而百度此番操作的核心，實則是圍繞使用者價值精心打造並全力揮出的一套組合拳。

3 月 16 日，百度正式釋出了文心大模型 4.5 及文心大模型 X1，並提供免費使用服務。在此之前，百度宣佈推出文心大模型 4.5，還計劃在未來幾個月內迅速推出文心大模型 5.0，並於 6 月 30 日起正式開源。

時間再往前倒一個月，2 月 16 日晚，百度搜索和文心智慧體平臺宣佈全面接入 DeepSeek 和文心大模型最新的深度搜索功能。

2 月 13 日，文小言宣佈自 4 月 1 日 0 時起全面免費，使所有 PC 端和 APP 端使用者都能體驗到文心繫列最新模型及其功能，如超長文件處理、專業檢索增強、高階AI繪畫、多語種對話等。

然而，並非所有大廠都願意接入 DeepSeek，一些大廠可能出於多方面的考慮，對是否接入DeepSeek持謹慎態度。

例如從技術競爭角度來看，部分公司可能擔心接入 DeepSeek 後，會在一定程度上削弱自身在技術方面的獨特優勢，從而影響其在市場中的競爭力。在商業利益方面，他們也需要評估接入 DeepSeek 對其自身商業利益的影響。例如，接入 DeepSeek 後可能會改變現有的市場格局和競爭態勢，對公司原有的市場份額和盈利模式產生衝擊等。

但百度在這一戰略抉擇中展現出差異化的格局 —— 作為中文網際網路領域少有的具備全棧 AI 能力的企業，這種底氣不僅體現在日均千億級真實需求的演算法錘鍊，更植根於二十多年中文語義理解的場景沉澱。