西風 發自 凹非寺
量子位 | 公眾號 QbitAI
一天內,OpenAI、百度兩家AI大廠同時打出免費牌!
幾天前被爆出文心5.0訊息後,今天百度突然宣佈:
文心一言將於4月1日零時起,全面免費! 所有PC端和APP端使用者均可體驗文心繫列最新模型。
與此同時,文心一言上線深度搜索功能,OpenAI一週前緊急開直播將推理大模型思考能力用於聯網搜尋,還沒捂熱乎,百度接著 給 我 破~
卷,大模型現在也太捲了吧。

據瞭解,最新深度搜索功能,「推理模型+搜尋」直接將複雜問題問答查詢拉至專業級,具備更強的思考規劃和使用工具的能力,同樣4月1日起免費開放使用。
量子位童鞋第一時間上手體驗了一波。
每次搜尋時,它會靈活規劃呼叫程式碼直譯器、高階聯網、AI繪圖等各種工具,並附帶思考和行動過程,最終形成一個高質量多模態輸出,有表格、圖片、程式碼的那種。

比如,針對馬上票房破百億的《哪吒2》,你可以隨便將各種你想問的問題一連串發給它,無需一個一個地問:
哪吒2為何如此受歡迎?為什麼說敖丙是個橙子?幫我生成一個大橙子漂在海面上的圖。就“為什麼敖丙一家子顏值都很高,但北海和南海龍王相貌奇怪”做分析
秒秒鐘它就能完成思考規劃,然後分別對每個問題作答,一連串問題一個不漏都能回答對:

敖丙是敖閏侄(orange)這樣的梗也能理解。

話不多說,接下來繼續深入瞭解一下~
最新深度搜索功能一手實測
文心一言深度搜索的開啟方式是這樣嬸兒的:

和普通AI搜尋大有不同,深度搜索主打的是提供專家級的複雜問題問答查詢服務,針對專業諮詢類問題進行了加強。
其回答過程是先對使用者核心需求進行分析將問題劃分步驟,然後呼叫工具進行搜尋思考整理,最後思考完成輸出結果。
深度搜索,多模態輸出
先來點小菜開開胃~
接開頭,一個哪吒站起來了,自然而然會想:還有哪些中國神話故事適合改編成動畫?
普通AI搜尋一聽到“中國神話”,這時可能就要把盤古、女媧、伏羲、神農等給搬出來了。
深度搜索一開始也確實透過聯網搜尋工具搬了一堆,belike:牛郎織女、女媧造人、盤古開天、嫦娥奔月、大禹治水、伏羲畫卦、后羿射日……

不過在此過後,深度搜索還多了一步思考和分析的過程,於是乎“一發入魂”:
考慮到使用者提到最近哪吒2爆火,說明哪吒這一人物形象深受觀眾喜愛,因此,我選擇與哪吒相關性強且情節豐富、人物性格鮮明的故事——《大鬧天宮》。

不得不說,選在了大夥兒的心趴上~~

再來點複雜的,查一下封神榜諸神譜系。
深度搜索從被封的第一個神(三界首領八部清福正神 柏鑑)起,將365路正神扒了底朝天。

接著還可以對部分人物成長曆程按時間線進行整理,寫一份分析報告。

更亮眼的是,如果你覺得這樣的查詢結果分析起來還是不明瞭,還可以讓它根據從網上搜來的資訊,劃分主要神祇的層級關係。
畫圖表、列表格都不在話下。

有了這樣的工具加持,以後再做分析報告整理素材就簡單多了。
而且其聯網搜尋還是即時的,可以緊跟最新訊息和熱點,詢問天氣啥的也都行:

多工具,靈活呼叫
針對工具規劃及呼叫能力的提升,文心一言深度搜索還能夠分析民生、創業、經濟等更加專業的複雜問題。
深度搜索可呼叫的工具包括高階聯網、程式碼直譯器、文件問答、圖片理解、AI繪圖、詞雲生成等,支援上傳文件和圖片。
比如你想了解瑞幸咖啡最近的經營情況,就可以上傳手頭裡有的資料,讓它結合起來分析:

深度思考會結合使用者上傳的資料自動規劃,如果報告中缺少某些資料也會提醒自己接下來要用高階聯網查詢:

思考過程中,如果有畫圖表等需求,它就會自動啟用程式碼直譯器進行繪製:

最後給出一份圖文並茂的綜合性調研:

像下面這種查詢,深度搜索也能幫上忙:
想在北京開一家寵物友好的咖啡館,預算50萬。請幫我:1)分析周邊3km競品情況;2)計算預期成本和收益;3)列出所需證照清單;4)設計一份特色選單
它會挨個逐步解決每個小問題,一次高階聯網解決一個小問題後,再啟用高階聯網獲取下一個,條理清晰。
思考過程細節滿滿,成本估算中也會標明地段、裝修、裝置配置等是按照何等標準進行估算的。

另外,還可以上傳圖片讓它結合網路資訊解讀,梗圖也能看懂。

最最最後,馬上就要情人節了,送男/女朋友什麼禮物好呢?

幫忙編寫一個愛心小程式吧~

大模型裡最懂搜尋,搜尋裡最懂大模型
一番體驗下來,文心一言的深度搜索確實讓人眼前一亮。
畢竟,百度靠搜尋起家,在中文網際網路領域具有深厚積累。
從技術上來說,百度一大優勢就是其RAG技術。
結合了語言模型和資訊檢索,百度RAG具備中文深度理解、多模態檢索、垂直領域定製化以及即時資料整合能力等優勢,尤其是在中文網際網路、企業服務等場景中。
此外,其研發的“理解-檢索-生成”協同最佳化的檢索增強技術,將回答問題的過程拆分成了三個階段,大幅提升了大模型技術及應用效果。
從去年年初開始,百度還在重點攻克iRAG技術。
iRAG,即Image-based Retrieval-Augmented Generation,是一種結合檢索和生成的技術方法,專門應對影像生成的幻覺問題,可以提升生成內容的可靠性和準確性。
其核心是將百度搜索的億級圖片資源與文心大模型的生成能力相結合,透過聯合最佳化,讓生成圖片更加真實可信。
在影視作品、漫畫作品、連續畫本、海報製作等多領域,iRAG都有廣泛的應用空間,可幫助使用者大幅降低創作成本。
而深度搜索,正是將這些技術能力囊括其中。

話說回來,百度這波免費操作,著實來得太突然。
大手一揮,最強模型全民也皆可免費使用了,著實在Open的路上邁出了一大步。
據瞭解,這背後其實是文心一言訓練和推理成本的雙雙降低。
最近李彥宏在公開場合表示:
在過去,當我們談論摩爾定律時,每18個月,效能翻倍、成本減半。但是今天,當我們談論大語言模型時,12個月推理成本就能降低90%以上。
為何能做到如此突破?不妨盤盤百度的殺手鐧:
訓練方面,百度有高性價比崑崙芯的加持,能夠在更少的計算資源下執行大規模模型,直接降低單位算力成本。
百度智慧雲還有萬卡大規模叢集,據悉計劃擴充套件至3萬卡。大規模叢集可以透過任務並行排程、彈性算力管理等方式,提高計算資源利用率,避免算力閒置,整體算力成本再降一截。
除此之外,百度還有百舸平臺助力,百舸提供全面的故障診斷手段,以保大規模叢集執行訓練任務的穩定性。
推理方面,百度尤其還有飛槳深度學習框架的支援,其中並行推理、量化推理等都是飛槳在大模型推理上的自研技術,推理成本也被打下來了。
目前,文心一言使用情況根據公開資料顯示,截至2024年11月,使用者規模為4.3億,文心大模型日均呼叫量超過15億次,較2023年增長超30倍。
那麼問題又來了,百度下一步要做什麼?
CNBC引述知情人士爆料稱,百度計劃在今年下半年釋出下一代人工智慧模型Ernie 5.0,將在模型多模態能力方面有重大增強。
結合奧特曼劇透GPT-5也要來了,如此來看,2025年下半年,基座模型“5.0競賽” 就要來了。
— 完 —
一鍵關注 👇 點亮星標
一鍵三連「點贊」「轉發」「小心心」
歡迎在評論區留下你的想法!