老是出錯的AI搜尋,要被夸克整頓了?

現在是週日,天都黑了,眼瞅著快到 23 點 59 分了,差評君的量子計算文章還沒寫完。

 主要這玩意又燒腦,要查的資料還多,再加上搜集資料、整理觀點啥的,那都不是一般的費時間。

那有差友可能就要問了,你小子這兩年天天吹 AI,咋這時候你就記不起來用?
該說不說,AI 搜尋這玩意在我這兒確實能幫上忙,但不多。
經常用的哥們都知道,AI 給你的東西乍一看經常還可以,起碼外行看起來是挺唬人的;

 但你要是門兒清,仔細一讀就會發現這玩意是一眼丁真,有的資料找不著來源、有的概念是舊版本、甚至它給的有些論文都根本是編的,所以最後調研一圈,哥們經常會浪費了倆小時。。。

完事我再上網一搜,發現吐槽這事的還不是少數。
網友們也發現了 AI 會亂編遊戲攻略和劇情,甚至百科網頁裡明明有的東西它都能搞錯。
該說不說,AI 搜尋這東西打幾年前 New Bing 那時候就在做了,但現在都 2025 年了,還會掉鏈子,那屬實是有點不應該。

 不過這倒不是 AI 本身不行,主要大模型這塊兒有一些根本問題,實在是不好規避,比如幻覺。

簡單來說,大語言模型這東西,本質上其實是基於機率統計的模型。所以模型可能會腦補一些不存在的資訊,尤其是在面對資訊碎片化、缺乏明確答案的問題時,這種幻覺就更加明顯。
而另一方面, AI 搜尋啥的都是靠搜尋引擎在網頁裡扒資料,但這裡面既有學術報告,也有營銷軟文,甚至還有謠言和垃圾資訊。信源的質量很難保證,所以才很容易生成錯誤答案。
這就跟在垃圾堆裡挖礦似的,挖到的東西就不光有金子,更多的還是垃圾。
雖說這都是大模型自己的問題,但咱要想讓 AI 搜尋不胡說八道,是真就完全沒有辦法了嗎?

 有的兄弟,有的。

咱國內這邊還有高手,阿里的夸克團隊為了把 AI 搜尋搞好,這次他們就專門做了一套最佳化方法。
比如說,一般的模型不是愛胡亂腦補嘛,那就直接換成聰明的,現在最先進的推理模型,這就能在一定程度上解決問題。
但要用在 AI 搜尋上,如果只靠外掛 DeepSeek,那其實也不好說就能做到深度融合,發揮出推理模型的優勢。

 要想最大化推理大模型的能力,靠自家手段反而更保險,這也是為啥做機器人的 Figure 會脫離 OpenAI,轉投自研。而夸克他們也是用的阿里自家的推理大模型。

然而對於傳統 AI 搜尋信源質量差的問題,這就沒法靠大模型解決了。
拿開頭差評君在研究的量子計算來說,如果想知道現在的學術界有啥操作這些微觀粒子的新思路,還得靠最新的權威資料,比方說頂尖大學的研究資料,學術論壇裡大佬們的最新觀點啥的,這些在網上都找不太著。

 但要想搭建這樣一個數據庫,那可就不容易了,知網的收費大家還記得吧,而你要想搞專業 AI 搜尋,光知網的資料還遠遠不夠。

所以國內真正有這個實力的,其實大家都能想到,也就剩那幾家了。而他們阿里這次就專門掏錢搞了資料庫。
不過,雖然人家說是這麼說,這些介紹聽起來頭頭是道,但你要問我他們這是不是在吹牛,那我只能說,在沒有親身體驗之前,咱還真不敢輕易下定論,更別提直接蓋章認證了。

 畢竟,之前的 AI 搜尋…前面也說了,大家都懂的。當然為了給差友們一個客觀交代,差評君我也是主動出擊,提前要來了內測名額,上手好頓體驗。

而結果嘛,說句實在話,還真有點出乎意料。人家大廠這技術力,還真不是蓋的。
不多 bb 了,直接給兄弟們看成果。
比如第一個測試,我問一個它經典科幻思想實驗,有點燒腦的祖父悖論問題,考驗考驗這玩意的推理能力。
向上滑動檢視更多
實話說,夸克的回答分析緯度比我想的還要多,除了大家能想到的技術預言測試,還提到了檢測異常粒子、檢查蟲洞穩定性啥的概念,甚至知道從技術倫理觀變遷這個思路( 出自 1895 年的科幻小說《 時間機器 》 )來證偽,屬實有點實力。
而且整個回答看著也是相當有邏輯的。

 不過為了測試它的多輪提問能力,我還專門連續追問了幾個問題,如果人家武器用的未來科技,你咋檢測?如果這兇手是平行時空的,那能不能定罪?

向上滑動檢視更多

結果夸克 AI 不但能夠記住這一串問題的上下文語境,邏輯一致,還層層遞進地深入解答,分析判決有啥困難,得想啥辦法透過法律手段給他判了。

 這裡麵人家還給出了不少參考資訊,除了援引法律法規,還參考了像《相對宇宙》這種科幻美劇,甚至提到了宇宙學家 Tegmark 在《 Our Mathematical Universe 》裡提出的數學宇宙假說。

整個對話過程可以說相當自然、資訊連貫,跟羅老師和大劉坐一桌開研討會似的。
不過光推理那還只是基本功,AI 這玩意真要讓人高看,那還得有拿得出手的本事,比如說寫作。
估計夸克團隊也是早想到哥們要測這個,專門把 AI 寫作入口放到搜尋框頂上,裡邊還把詩歌的體材字數啥的都歸納好了,什麼小作文、文案、問卷、心得體會都會搞。
我讓他以量子力學裡經典的雙縫干涉實驗為主題寫一首七言律詩。
你別說,這還真挺像那麼回事的,小味兒馬上就有了。

 但是對咱們來說,測了這麼多 AI ,一般的文章生成那都是灑灑水,沒啥意思,要來就給他上上強度,直接讓他生成 ppt ,先來一份 20 頁以上的火星殖民可行性報告吧。

結果沒想到人家考慮這麼詳細,各種保障就不說了,甚至連預算從哪來都考慮進去了。到最後還支援換模版,調大綱,那還真挺實用的,我覺得換個顏色,再湊點字數,應該都能拿去 NASA 拉贊助了。( 

 )

但相比其他 AI 搜尋,更讓我直呼牛逼的是它在知識視覺化這塊兒。

 拿量子計算來說,這裡面有大量嚴謹枯燥的數學分析,物理概念,純看文字能累死。

但對夸克 AI 搜尋來說,要理解這些就輕鬆很多了,比方我讓他整理目前主流的量子計算方向,人家可以給你畫框圖畫表,逐個分析。
不過,就這還只是問答環節的能力,你要用了它搜尋框下面的功能元件,才會發現這玩意的多模態有多厲害。

 就比如說,人家不僅支援照片輸入和文字識別,還把這種能力開發到了能直接搜題的程度。

咱直接按首頁的解題大師,把張融合了近代史和物理的燒腦題丟給它看看。
你瞅瞅,直接就能出答案,如果你還是看不懂,那還可以夸克追問。說白了這東西可以當學習機使, AI 家教整上了。
除了這個,人家這回答的專業性還很強,就比如說我想了解量子力學這玩意到底怎麼跟哲學掛鉤的,從搜尋框上這個學術搜尋裡邊問就完了。
結果人家不僅回答得很詳細,參考了一堆學術資料,還能生成大綱和腦圖,最後還附帶圖片和相關影片,生怕我看不懂是吧。

 完事你別說,我後面還專門查了量子力學跟哲學交叉的文獻資料,發現就算在這種小眾冷門的學科裡,人家這回答也是相當專業的,這可比經常出幻覺的大模型高的不知道哪裡去了。

而這其實就是前面說的,他們夸克團隊自建了專業資料庫,還跟知網、萬方等頂尖資料庫深度合作,這才把權威專業做好。甚至他們在醫療上也投入巨大。

 又有學術上的專業,又有強大的泛化能力,這我是真喜歡。

不過要我說,夸克 AI 這波更新,最牛的還不全在搜尋上,因為這玩意壓根就不是光用來搜尋的。
比如當你提問寫作問題時,它會自己呼叫上面咱說的那個寫作助手;問健康問題時,它又會呼叫夸克健康助手;提問學習問題時,它不光給你講,還在下面指路課程影片和資料。
也就是說,這玩意是帶智慧的,能主動識別你想幹啥,根據你的不同意圖來自動呼叫各種資料和 AI 工具,最大完成度的來實現任務,滿足各位的需求。

 所以說,夸克這哪是搞了個 AI 搜尋,完全是搞出了 AI 搜尋的完全體,超級 AI 應用嘛。

實際上,不光咱是這麼看的,前幾天阿里巴巴官號也釋出了夸克升級產品的影片,貼上了 “ 阿里 AI 旗艦應用 ” 的標籤。
但要我說的話,夸克 AI 的更新其實是整個 AI 應用層面變革的縮影,跟之前只會單純問答解決問題的 AI 應用相比,夸克實際上說明 AI 正在從問答搜尋時代邁向全域 AI 時代。

 說人話就是,這樣一個搜尋框裡能呈現的就不只是一般的問答裡,更是一個AI 超級框,滿足使用者的所有需求,找答案、做分析、寫方案、寫作、解題,作圖等等,成為使用者的個人全能助手。

從這個層面上來說, AI 對大家的便利會進一步提高,與其擔憂 AI 的威脅,不如先擁抱 AI 的機遇,善用夸克這樣的智慧工具吧。
撰文:納西
編輯:江江 & 面線
美編:煥妍
圖片、資料來源
Cognitive Mirage : A Review of Hallucinations in Large Language Models 
Philosophic Foundations of Quantum Mechanics 
夸克、微博等,部分圖源網路。


相關文章