實測文小言升級:開始「卷體驗」的百度都眉清目秀了

支援多模型融合排程,升級全新語音大模型、圖片問答能力。
作者丨鄭佳美
編輯丨馬曉寧
剛剛無縫接入文心 4.5、文心 X1 和 滿血版 DeepSeek-R1 的文小言,轉身又整出了新動作。
3 月 31 日,文小言迎來了一次全面升級,上新了多模型融合排程、全新語音大模型、圖片問答、拍題講解等多種新功能。
新功能聽起來很厲害,但實際使用效果又如何?不多贅述,AI 科技評論先替大家實測一波。
1
更強大的“大腦”
據透露,文小言目前已經集齊了市場上的最強模型,擁有了更強大的“大腦”。
這一點體現在了這次升級中的多模型融合排程功能上,而所謂的融合呼叫,其實就是在面對不同型別的問題時,文小言可以自己選擇能夠提供最優解的模型,從而保證使用者的使用體驗。
實測階段,我先是丟給了它幾張鸚鵡的圖片,並問它圖中鸚鵡的性別,這個問題對於我來說,難度不亞於“憑鳥腿斷品種”的難度,而文小言卻輕鬆回答,並且給出了判斷依據。之後我又讓資深養鳥發燒友也看了一遍,最終的答案和文小言給出的答案完全一致。
後續我又翻出來了兩張衣服吊牌的圖片給它,並讓它幫我分析一下圖中的衣服哪件的面料更適合徒步。緊接著的一連串的推理分析中,它不僅分析了面料的透氣性和耐磨性,甚至連吸水性都考慮了進去,有些暖心了。
除了分析衣服面料,我還把幾張護膚品的成分表扔給了文小言,讓它幫我挑一個適合敏感肌在春天使用的款式。我本以為它會把所有拗口的成分全都羅列出來分析一遍,沒想到它只是對每個產品的優缺點進行了展示分析,直接明瞭的對比了不同產品可能帶來的使用效果,最後給出了明確的對比結果。簡單直接又通俗易懂。
同理,我還用它測試了一下醬油的配料表,讓它幫我挑一個健康的醬油。不出所料,分析過程十分詳細,還把每種元素的多少所對應的適應人群給分析出來了,細節拿捏的很好。
測試到這,其實我就已經對文小言的“更強大腦”有了一些認同感,但又覺得這可能並不是極限,於是翻出了一張之前的驗血報告甩給它,讓它用大白話幫我分析一下報告中顯示的身體狀況,並給出一些後續的保養意見。不得不說,它最終給出的答案,確實是大白話,也確實挺準確。
除了擅長推理分析,文小言還能看圖識景,只需給它一張圖片,就能精準識別圖片中的景點,哪怕是隻有一條河亦或是一座山,都能被它“一眼看穿”。
更為複雜的人文風光也同樣不在話下,根據建築風格和自然景觀輕鬆識別出正確答案。
除此之外,我還上傳了一張英文選單,並命令文小言在有限的預算內,結合我的飲食習慣,幫我翻譯並規劃如何點菜。雖然最終的結果並沒有將中英文菜名一一對應展示,但給出的結果還是比較符合常理,如果真的在日常生活中使用到的話,屬於是比較好用的一個功能了。
文小言除了能化身集翻譯預算控制為一體的點單神器外,在拍照解題方面也是一把好手,例如在解決一些簡單的數學問題上,也不再是列出冗長且較為晦澀的解題過程,而是直接亮出真人解題影片,簡單又直接。
2
更會說的“嘴巴”
當然,文小言這波升級,不僅有了更強大的“大腦”,還有了更會說的“嘴巴”,即更強大的語音大模型功能。實測下來,感覺文小言的語音功能反應速度很快,而且還是個“捧哏”選手,永遠不會讓話落在地上,感覺可以和豆包有一拼了。
測語音功能時,我用的還是第一個鸚鵡分公母的問題,這次我直接用語音問它,問題前腳剛問完,僅僅過了兩秒鐘,文小言就開始侃侃而談,而且還有很多語氣助詞,很貼合日常生活中人與人之間那種對話的感覺,而且問題解答得也很透徹,還支援互動交流,體感拉滿了屬於是。
除了答得快、答得好,文小言的語音互動甚至還支援用方言回答,雖然有些語調還稍微欠缺點“人味”,但整體聽起來並沒有那麼違和,方言這塊雖然讓我很驚喜,但是覺得還是有可以提升的空間。
語音這塊,還有一點讓我覺得很有意思的是,文小言竟然還是個“帶娃高手”,可以快速接收小使用者的需求並且迅速反應調整輸出的內容。例如,當給小朋友用文小言講故事,但它講的故事小朋友都表示聽過的時候,文小言還能快速反應,找到更多的故事講給小朋友聽,不給他留下一點哭鬧的機會,“帶娃高手”實錘。
整體來看,文小言的語音大模型還是非常亮眼的,這一切都要歸功於百度釋出的業界首個基於全新互相關注意力( Cross-Attention )端到端語音語言大模型,它在實現了超低時延的情況下也實現了超低的成本,在相關問答場景中,呼叫的成本比行業均值下降了50%-90%
從目前的表現來看,百度在語言模型技術上已經取得了顯著的領先優勢,但更值得關注的是,百度的領先並不僅限於技術層面。事實上,它在應用生態和產業佈局上也展現出全面的優勢,這種多維度的突破正在重新定義行業競爭的格局。
3
更開放的精神
縱觀百度近期這一系列密集的動作,不難發現文小言只是其中的關鍵一環,而百度此番操作的核心,實則是圍繞使用者價值精心打造並全力揮出的一套組合拳。
3 月 16 日,百度正式釋出了文心大模型 4.5 及文心大模型 X1,並提供免費使用服務。在此之前,百度宣佈推出文心大模型 4.5,還計劃在未來幾個月內迅速推出文心大模型 5.0,並於 6 月 30 日起正式開源。
時間再往前倒一個月,2 月 16 日晚,百度搜索和文心智慧體平臺宣佈全面接入 DeepSeek 和文心大模型最新的深度搜索功能。
2 月 13 日,文小言宣佈自 4 月 1 日 0 時起全面免費,使所有 PC 端和 APP 端使用者都能體驗到文心繫列最新模型及其功能,如超長文件處理、專業檢索增強、高階AI繪畫、多語種對話等。
然而,並非所有大廠都願意接入 DeepSeek,一些大廠可能出於多方面的考慮,對是否接入DeepSeek持謹慎態度。
例如從技術競爭角度來看,部分公司可能擔心接入 DeepSeek 後,會在一定程度上削弱自身在技術方面的獨特優勢,從而影響其在市場中的競爭力。在商業利益方面,他們也需要評估接入 DeepSeek 對其自身商業利益的影響。例如,接入 DeepSeek 後可能會改變現有的市場格局和競爭態勢,對公司原有的市場份額和盈利模式產生衝擊等。
但百度在這一戰略抉擇中展現出差異化的格局 —— 作為中文網際網路領域少有的具備全棧 AI 能力的企業,這種底氣不僅體現在日均千億級真實需求的演算法錘鍊,更植根於二十多年中文語義理解的場景沉澱。
整體來看,在大模型的開放浪潮中,百度一直緊跟行業風向標,以自身的實際行動,不斷地推動著行業的發展和變革。它透過這一系列緊密相連的舉措,不僅在技術上與國內外領先水平保持同步,更在使用者服務和市場佈局上展現出了獨有的競爭力。
這種以使用者價值為核心,以開放創新為驅動的發展模式,不僅為它在 AI 領域的未來發展奠定了基礎,也為 AI 技術向著更加開放,更加惠普、更加智慧化的方向發展,為使用者創造更多價值。
大模型開放是大勢所趨,行業領軍者都在主動開放,而百度早已身在其中。

更多內容,點選下方關注:

未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社群進行轉載!
公眾號轉載請先在「AI科技評論」後臺留言取得授權,轉載時需標註來源並插入本公眾號名片。

//
推薦閱讀

相關文章