近日,知乎 AI 搜尋產品知乎直答正式接入「滿血版」DeepSeek R1!在社群優質內容、專業知識庫基礎之上,全面升級了推理能力,為你帶來全新的 AI 搜尋體驗。
知乎直答的 R1 體驗到底如何?究竟好不好用?一起來看看答主的回答吧。
知乎直答接入滿血版 DeepSeek-R1,體驗感如何?好不好用?
|答主:桔了個仔
結論先行:
-
知乎這波可謂是走對路子了,最好的開源推理模型,和中文網際網路上最優秀的語料結合,讓直答的專業能力大大增強。
-
有人問和直接用 deepseek 有啥不一樣?不一樣之處在於,直答在參考來源上,給了知乎社群最高的權重,更偏向解決專業問題。
-
面對複雜和小眾問題,Deepseek R1 加持了也不一定好用,而且 R1 其實幻覺問題更嚴重,在使用結果時需要小心。不過我認為,其推理過程比結果更有價值。

先來個相對簡單的問題吧。

不知道其他答主覺得風格對不對,但就我這段風格模仿,只能給個 80 分吧哈哈,不過它採用遞進的方式,確實有點像我,我寫東西就很喜歡遞進。

但是寫多了,容易露餡。例如我讓它繼續模仿我,它雖然寫得挺好,但語氣就更不像我了,至少我寫技術文章時,基本不會一上來就「兄弟們」。

簡單的問題難不倒 R1,那就上點難度。
我年前寫了一篇在安卓上部署 DeepSeek 的教程,並在文末表示想在 ios 上試試部署。
剛好知乎直答接入 DeepSeek R1,那就用直答來幫助我寫這個教程吧。

於是,我讓給我寫一個完整的餵飯級教程,怎麼在蘋果手機上部署並執行 DeepSeek R1 7B 開源模型
當然,一開始,知乎直答也和 DeepSeek App 一樣,響應不過來了,看來知乎直答得趕緊擴容。

重新問了一遍,好了。

從上面標紅的部分可以看到,它參考了很多知乎上的文章,包括我之前寫的一篇文章,在參考來源第 7 條。

其最後給出的回答也是有理有據的,甚至給出了所需工具的下載連結,雖然連結不太對(第一個跳轉到官網而非 App store,第二個 404),但名字對了,自己去搜一下就好了。

甚至還給出進階設定。

不過,App Store 上並沒有名為 MLC LLM 的應用,如果要用,則需要自己從原始碼中 build。雖然 MLC LLM 網站上推薦了名為 mlc chat 應用,但這個應用不能匯入外部模型。

不過,在我搜索應用的過程中,找到其他可以匯入模型的 app,例如 LLM Farm,On-Device AI 等,大家可以試試。
出了個更垂直的題目考考直答。要它根據 DeepSeek R1 和 In-Context Lora,製作四宮格漫畫

可以看到,它把知乎文章和回答作為主要參考來源,其中第一篇是我之前寫的文章。
不過這篇文章寫的是插畫而不是四宮格漫畫。我出這個問題,是想看看其舉一反三的能力。
參考來源中,除了知乎,它也搜尋了 CSDN,個人部落格等各種資料。
DeepSeek 根據搜尋結果,進行了如下思考過程。

可以看到,每一步都是對的。




總體來說思路是對的,不過很多細節都沒最佳化好,例如怎麼讓 AI 生成四宮格,而不是四個大小不一的圖片。
可以追問,讓它再詳細點。


但 ComfyUI 裡面跑程式碼不方便,於是我可以繼續問。

然而,正如社群發現的,DeepSeek R1 的幻覺問題還是挺嚴重的,例如紅框部分,其實並沒有 In-Context Lora 的外掛,In-Context Lora 是一系列權重。
當然,你可以去糾正它。

但給出的回答依然還是有幻覺。

當然這個例子我測試的問題有點多,就不一一截圖了。
這個例子表明,當你用一個不算很熱門的技術框架時,而且其中涉及很多步驟時,R1 很大機率會出現幻覺,無法做出你想要的效果。