
作者丨鄭佳美
編輯丨馬曉寧
2 月 13 日,文心一言在官網宣佈將於 4 月 1 日 0 時起全面免費,所有 PC 端和 App 端使用者均可體驗文心繫列最新模型,以及超長文件處理、專業檢索增強、高階AI繪畫、多語種對話等功能。
同一時間,OpenAI 執行長 Sam Altman 也公佈了 GPT-4.5 和 GPT-5 的最新訊息。免費版 ChatGPT 能在標準智慧設定下無限制地使用 GPT-5 進行對話。
訊息一齣,不少網友下場直呼:AI 普惠的時代來臨了!

AI 科技評論一手實測對比了文心一言 3.5 與 4.0 的兩個版本的區別後,不禁感嘆,百度這波真的是誠意滿滿了!
先是扔給大模型一個提示詞:請參照原文:“日照香爐生紫煙,遙看瀑布掛前川。”在新的主題上進行仿寫:昆明湖仿寫要求:模仿風格及格式,寫兩句詩。
文心一言 3.5 給的結果雖然工工整整,但僅有一句話,並沒有看到思考過程。

相比之下,文心一言 4.0 的回答就顯得全面很多。不僅分析了原文的詩詞意境和寫作手法,更是對輸出的內容進行了一波全面分析,直觀且通俗易懂。

詩詞續寫之外,再扔給文心一言一個腦洞大開的問題:世界八大奇蹟哪一個最有可能是外星人建的,嚴謹地推理一下。
文心一言 3.5 的回答中規中矩,並沒有給出明確的答案,字裡行間透露著一種“朦朧感”。

而文心一言 4.0 則是正面回答了這個問題,答案和分析過程都很直觀,除此之外還給出了富媒體內容。

在圖片生成方面,兩個版本的文心一言在生成內容上也有明顯差異。
同一個提示詞:“幫我畫一個奧黛麗赫本吃湯圓。”文心一言 3.5 給出了一張看起來“AI 味”滿滿的圖。

而文心一言 4.0 則是依託 IRAG 能力,生成了更準確的人物臉部,沒有“AI 味”,更真實更準確,並且一次生成了很多張。

經過實測,可以直觀的看出文心一言 4.0 版本相較於之前的 3.5 版本,已經發生了質的飛躍。這個版本不僅在語言理解和多模態能力上大幅提升,還新增了深度搜索等超強功能。
4.0 版本的文心一言,對專業諮詢類問題的解決能力進行全面加強,可以輕鬆應對專業問題查詢門檻高、查詢渠道專精、查詢結果分析難度大等使用挑戰。同時在民生、創業、經濟分析等方面問題,也能夠提供專家級的內容回覆。
除此之外,4.0 版本還具備了更全面的思考、規劃、反思能力,針對工具規劃及呼叫能力上進行了全面加強,能夠更加“聰明”的使用多個工具解決各類複雜任務問題。例如先搜尋內容,再配合程式碼直譯器;或者閱讀上傳文件、再搜尋分析,最後綜合給出結果。
提升了使用者體驗的同時,也進一步降低了人們在使用 AI 方面的門檻。

而縱向對比一下現在市場上主流大模型的開放能力,你會發現文心一言其實是一個“六邊形戰士”。
諸多衡量標準中,RAG 作為大模型競爭的核心能力之一,是衡量大模型優劣的重要維度。而百度在 RAG 的技術上具備中文深度理解、多模態檢索、垂直領域定製化以及即時資料整合能力等優勢,在中文網際網路、企業服務、政務等場景中具十足的實用性和競爭力。
並且從 RAG 能力實測來看,國內外主流大模型中,百度文心一言綜合表現最為亮眼。
但回顧一下 AI 搜尋相關的技術發展,其實本質上都是對 RAG 技術的延伸,在不斷的迭代中,文字層面的 RAG 技術已經基本讓大模型消除了“幻覺”,但在多模態方面,尤其是影像生成,RAG 技術的運用還遠遠不夠了。
網上經常可以看到各種大模型的文生圖功能產出的失敗案例,不僅一眼假,還往往背離物理邏輯,出現各種張冠李戴的“幻覺問題”,充滿的“AI 味”。
而百度早就意識到了這一點,在去年就自研了一種專門解決影像生成幻覺問題的 iRAG 技術,早早地就走在了行業的最前面。

百度的 iRAG 技術是一種結合檢索和生成的技術方法,用來提升生成內容的可靠性和準確性。它將百度搜索的億級圖片資源跟強大的基礎模型能力相結合,進而生成各種非常真實的圖片,呈現出來的效果是原始文生圖系統無法比擬的。
而 iRAG 讓生成的圖片沒有“AI 味”的同時,也可以幫助使用者大大降低創作成本。總的來看,百度這波全面放開文心一言的操作,真就是把最好的內容拿給使用者了。
毫無疑問,百度宣佈文心一言全面開放,是背後技術突破與成本降低的結果。
最近李彥宏在“世界政府峰會”上就表示:“在過去,當我們談論摩爾定律時,每 18 個月,效能水平或價格都會減半。但是今天,當我們談論大型語言模型時,增加的成本基本上降低了,可以在 12 個月內降低 90% 以上。”
在訓練成本方面,百度透過崑崙芯的高性價比,減少了計算資源的需求,從而降低了算力成本。同時,百度智慧雲的萬卡叢集(計劃擴充套件至 3萬卡)利用規模效應,提高了資源的利用率,避免算力閒置,提升了計算效率。
百舸平臺則透過高效能網路和創新散熱方案,優化了大規模叢集的部署和管理,提升了通訊效率,降低了能耗。
為了解決大模型訓練時對高通訊頻寬的需求,百度建設了超大規模 HPN 高效能網路,透過最佳化的擁塞控制演算法和集合通訊策略,提升了通訊效率,將頻寬有效性提升至 90% 以上。同時,由於萬卡叢集能耗高,百舸採用了創新的散熱方案,有效降低了能耗,從而減少了電力成本。
為了提升 GPU 的有效利用率,百舸還不斷最佳化分散式訓練策略,透過高效並行化任務切分將訓練主流開源模型的叢集 GPU 有效利用率(MFU)提升至 58%。百舸還提供了全面的故障診斷手段,透過百度自研的BCCL(百度集合通訊庫)快速定位和修復故障,保障訓練任務的穩定性,將故障恢復時間從小時級縮短到分鐘級,確保叢集的有效訓練率達到98%。
除此之外,有分析人士猜測,文心一言全面開放的一個關鍵原因是推理成本的持續降低。
他們指出,百度在模型推理部署方面具有明顯優勢,特別是在飛槳深度學習框架的支援下,飛槳的並行推理和量化推理等自研技術大大提升了推理效能,並有效降低了推理成本。飛槳與文心的深度最佳化協同作用,使得推理的效率得到了進一步提高,同時降低了相關成本。

短短 2 月 13 日一天之內,OpenAI、百度兩家 AI 大廠同時宣佈全面開放自家大模型產品。
北京時間 2 月 7 日,OpenAI 宣佈 ChatGPT Search 向所有人開放,無需註冊,來到 OpenAI 官網首頁就可以直接使用搜索功能。幾小時之後,谷歌也宣佈向所有人開放最新 Gemini 2.0 模型,包括 Flash、Pro Experimental 和 Flash-Lite 三個版本。
頭部大廠的各種操作,隱約中讓人們慢慢看清了大模型行業未來的發展趨勢:全面開放。
AI 技術的開放不僅能夠降低技術的門檻,也可以讓越來越多的使用者和開發者能夠直接接觸到這些強大的模型和工具。同時,開放也意味著 AI 將更廣泛地滲透到各行各業,影響日常生活和工作模式。
或許隨著越來越多的企業加入到開放大模型的行列,AI 的應用場景將變得更加多元化,技術門檻會逐步降低,甚至可能形成一個更加開放和共享的 AI 生態。
而這場由百度、OpenAI等頭部大廠引領的 AI 大模型開放浪潮,也許僅僅是未來更大規模開放的開始,但在這個過程中,不僅是 AI 技術的推進,更是 AI 向人類社會的深度融合,進而帶來的更廣泛的創新機會與發展空間。
AI 普惠的時代,真的來臨了。



更多內容,點選下方關注:

未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社群進行轉載!
公眾號轉載請先在「AI科技評論」後臺留言取得授權,轉載時需標註來源並插入本公眾號名片。
未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社群進行轉載!
公眾號轉載請先在「AI科技評論」後臺留言取得授權,轉載時需標註來源並插入本公眾號名片。

「鯰魚」DeepSeek 正在攪動上下游

矽谷巨頭要學會接受一個事實:「DeepSeek 現象」只是中國 AI 崛起的開始

Andrej Karpathy 最新影片盛讚 DeepSeek:R1 正在發現人類思考的邏輯並進行復現
