知乎直答接入滿血版DeepSeek-R1,到底好不好用?

點選上方卡片關注👆
近日,知乎 AI 搜尋產品知乎直答正式接入「滿血版」DeepSeek R1!在社群優質內容、專業知識庫基礎之上,全面升級了推理能力,為你帶來全新的 AI 搜尋體驗。
知乎直答的 R1 體驗到底如何?究竟好不好用?一起來看看答主的回答吧。
知乎直答接入滿血版 DeepSeek-R1,體驗感如何?好不好用?
|答主:桔了個仔

結論先行:

  • 知乎這波可謂是走對路子了,最好的開源推理模型,和中文網際網路上最優秀的語料結合,讓直答的專業能力大大增強。
  • 有人問和直接用 deepseek 有啥不一樣?不一樣之處在於,直答在參考來源上,給了知乎社群最高的權重,更偏向解決專業問題。
  • 面對複雜和小眾問題,Deepseek R1 加持了也不一定好用,而且 R1 其實幻覺問題更嚴重,在使用結果時需要小心。不過我認為,其推理過程比結果更有價值。
測試 0:介紹一下我自己
測試 1:知乎上有哪些大模型話題優秀答主?列舉 10 個,並模仿他們語氣,來介紹一些 Deepseek R1 的亮點
先來個相對簡單的問題吧。
不知道其他答主覺得風格對不對,但就我這段風格模仿,只能給個 80 分吧哈哈,不過它採用遞進的方式,確實有點像我,我寫東西就很喜歡遞進。
但是寫多了,容易露餡。例如我讓它繼續模仿我,它雖然寫得挺好,但語氣就更不像我了,至少我寫技術文章時,基本不會一上來就「兄弟們」。
測試 2:寫一個餵飯級的 DeepSeek 部署教程
簡單的問題難不倒 R1,那就上點難度。
我年前寫了一篇在安卓上部署 DeepSeek 的教程,並在文末表示想在 ios 上試試部署。
剛好知乎直答接入 DeepSeek R1,那就用直答來幫助我寫這個教程吧。
於是,我讓給我寫一個完整的餵飯級教程,怎麼在蘋果手機上部署並執行 DeepSeek R1 7B 開源模型

當然,一開始,知乎直答也和 DeepSeek App 一樣,響應不過來了,看來知乎直答得趕緊擴容。

重新問了一遍,好了。
從上面標紅的部分可以看到,它參考了很多知乎上的文章,包括我之前寫的一篇文章,在參考來源第 7 條。
其最後給出的回答也是有理有據的,甚至給出了所需工具的下載連結,雖然連結不太對(第一個跳轉到官網而非 App store,第二個 404),但名字對了,自己去搜一下就好了。
甚至還給出進階設定。
過,App Store 上並沒有名為 MLC LLM 的應用,如果要用,則需要自己從原始碼中 build。雖然 MLC LLM 網站上推薦了名為 mlc chat 應用,但這個應用不能匯入外部模型。
不過,在我搜索應用的過程中,找到其他可以匯入模型的 app,例如 LLM Farm,On-Device AI 等,大家可以試試。
測試 3:用 DeepSeek R1 和 In-Context Lora,製作四宮格漫畫
出了個更垂直的題目考考直答。要它根據 DeepSeek R1 和 In-Context Lora,製作四宮格漫畫
可以看到,它把知乎文章和回答作為主要參考來源,其中第一篇是我之前寫的文章。
不過這篇文章寫的是插畫而不是四宮格漫畫。我出這個問題,是想看看其舉一反三的能力。
參考來源中,除了知乎,它也搜尋了 CSDN,個人部落格等各種資料。
DeepSeek 根據搜尋結果,進行了如下思考過程。
可以看到,每一步都是對的。
總體來說思路是對的,不過很多細節都沒最佳化好,例如怎麼讓 AI 生成四宮格,而不是四個大小不一的圖片。
可以追問,讓它再詳細點。
但 ComfyUI 裡面跑程式碼不方便,於是我可以繼續問。
然而,正如社群發現的,DeepSeek R1 的幻覺問題還是挺嚴重的,例如紅框部分,其實並沒有 In-Context Lora 的外掛,In-Context Lora 是一系列權重。
當然,你可以去糾正它。
但給出的回答依然還是有幻覺。
當然這個例子我測試的問題有點多,就不一一截圖了。
這個例子表明,當你用一個不算很熱門的技術框架時,而且其中涉及很多步驟時,R1 很大機率會出現幻覺,無法做出你想要的效果。
知乎熱門文章

近 9 成國人乳糖吸收不良,為何牛奶還是如此普及?

為什麼《哪吒之魔童鬧海》能成為中國影史票房冠軍?

家屬證實「大 S 因流感併發肺炎去世」,流感真的能致命嗎?

本文內容來自「知乎」
點選上方卡片關注
轉載請聯絡原作者
👇點選【閱讀原文】,看更多精彩回答

相關文章