知乎會被DeepSeek取代嗎?如今大火的幾個大模型到底誰更聰明?

點選上方卡片關注👆
近日,知乎 AI 搜尋產品知乎直答正式接入「滿血版」DeepSeek R1!在社群優質內容、專業知識庫基礎之上,全面升級了推理能力,為你帶來全新的 AI 搜尋體驗。
知乎會被 DeepSeek 取代嗎?如今大火的幾個大模型到底誰更聰明?一起來看看答主的回答吧。
知乎直答接入滿血版 DeepSeek-R1,體驗感如何?好不好用?
|答主:蘇洋
早晨用知乎直答的時候,非常好用,模型回答爽快,邏輯靠譜!不過,此刻的直答應該負載壓力很大,變的有些卡了,我建議等這兩天的熱度下去點,再使用體感會更好些。
能力驗證,沒有什麼比實際應用更直觀,我們用知乎直答來回答一個之前被邀請但沒回答的帖子內容——知乎會被 DeepSeek 取代嗎?
作為對比,我會將 ChatGPT Pro、Claude Pro、DeepSeek R1、朋友的 DeepSeek R1 滿血版、騰訊雲 DeepSeek 都貼上來作為對比。
知乎直答
首先測試的選手是知乎直答(2025 年 2 月 11 日晚上的卡頓版)

準備提問

開啟直答後,在介面中勾選「深度思考」,啟用 reason thinking 模式。
然後,對他提問,將上面測試問題中的題目和描述不做任何修改,直接貼上到模型裡。

等待回答

回答的過程中,能夠看到首先會搜尋相關的問題,然後將相關內容(社群使用者投票出的好的結果)和來自外部的少量內容一起塞給模型。
點開內容詳情,可以看到主要補充的內容都是站內的,也補充了一些站外的內容。

生成結果

我個人覺得回答的挺好的,給出了很多帶例子的答案,相比模型很多時候空對空,讓我覺得踏實不少。並且,能夠幫助我快速「去水」掉上面各路答案中的「知識點」之外的內容,閱讀效率上有了不少提升。

不足

我還挺想知道這些觀點對應的答主是誰,能不能把他們 at 出來,有的好的觀點的答主是值得關注,和期待他接下來的其他思考和分享的。以及,有一些我過濾掉的答主,能不能在總結的時候,去掉他的比較營銷感的內容。

其他

去年的時候,大家覺得模型會單純吸血知乎社群原有的生態和內容,現在看起來「補充提問」(AI 生成的建議問題,和下面的一鍵向人提問),應該也對知乎社群起到了輸血作用,可以提供更高質量的問題。
問 AI 問完了,和人再確認下,總歸可以更放心。
O1 Pro
這個對比有一些不公平,是個送分的 PK。
並不是說絕對模型能力,而是在沒有知乎站內、站外相關內容補充的情況下(O1 Pro 沒有搜尋能力,只有「深入研究」能力)

準備提問

還是填入相同的問題,開啟  thinking 模式。

得到回答

這次回答,沒有觸發思考模式(估計是有使用者問過類似問題,被快取了),它甚至還把思考的活兒又甩給了我…「你怎麼看呢?」

加試一輪

再問一把
我個人感覺,回答質量還是蠻好的。
O3 Mini High(搜尋啟用)
因為 O1 Pro 沒有聯網功能,所以我們加試一位 OpenAI 的代表:O3 Mini High。
O3 只能啟用推理或者強化思考。考慮到相關的知識更有價值,我們側重啟用搜索功能。

準備提問

等待回答

雖然也有思考,但是相比較深入研究,思考深度會淺不少(應付)

生成結果

生成結果而言,速度是非常快的,很多時候這類上下文少的簡單觀點問題,幾乎都是秒級得到結果,這個應該就是 OpenAI 出生在算力富裕家庭的優勢了,我們羨慕不來,那就和 DeepSeek 一樣,最佳化基本功能,用「破卡也能出結果」。
點開來源資訊,能夠看到 OpenAI 或許應該給知乎交點錢,因為這一個回答就爬了知乎的內容大概二十次……
雖然拿到的知乎內容數量比知乎直答資料還多,但是因為拿不到內容的優質分(隱藏值),也不能獲得更快的檢索效能(走公網,快取結果有限),所以在觀點輸出方面,結果是不如直答的。
Claude
Claude 和 O1 Pro 類似,這場 PK 註定是有很大劣勢的,雖然模型效能很好,產品在使用者意圖識別方面也做的很棒。甚至現在的產品裡,都有基於使用者歷史偏好來做內容產生。
但是,它和 O1 Pro 一樣,沒有聯網能力。

準備提問

為了得到相對好一些的答案,我們選擇了「囉嗦模式」,讓它多費點 token,來詳細點回答。

生成結果

生成非常的快,就結果而言,我覺得甚至沒有 O1 Pro 好,就滿滿的 AI 感(中規中矩的沒有錯別字的版本)。
澎峰的 DeepSeek R1 異構滿血版
這幾天朋友老王他們加班上了新產品,和知乎直答一樣,剛上線還挺快,現在估計已經因為很多人使用,導致輸出有點一頓一頓的了。
他們用的是一堆人看不上的國產晶片來整的,我覺得能順利跑起來,其實就很好了。反正你已經很卡了,不在乎再有點壓力了吧(壞笑ing

準備提問

還是一樣,把相同內容放進去,然後點選提交。

等待回答

看起來思考過程大差不差。就是現在有點卡,感覺不到舒爽的感覺…

生成結果

這個結果和上面的 O1 Pro、Claude 沒有差別,都是靠模型基礎能力,因為過程中沒有補充任何知乎站內資訊,更不會有補充內容攜帶權重,好壞示例的可能性,那麼模型就只能自己發揮了,看運氣抽卡。
這結果粗看,好像和直答還挺像(畢竟都是 deepseek …),就是沒有外部資訊補充。
Deep Seek 原版

我是真的不想測試原版,原因大家也都知道…慢

準備提問

還是同樣的事情,相同的問題,DeepSeek 官方能夠開啟 thinking 和 搜尋能力,都點上。

等待回答

相比較三方,官方版本永遠是思考最長的,有的人喜歡,有的人覺得沒用,只有結果有用,我個人覺得看場景。情緒價值也好,思考啟發也罷,或者就是新鮮勁,那看看模型自言自語蠻有趣的。
但是,你就是要結果的話,那麼這塊的展示可以隱藏掉的(Claude 設計了多種輸出風格,也是如此,不是所有人都需要詳細的模式)。

生成結果

DeepSeek 沒有挑戰爬知乎,引用了很多傳統媒體來源的資訊,所以風格和觀點,基本都是「編輯體」。
模型生成結果其實還是不錯的,但是吧,你看這個引用內容,你倒是挑挑再用啊!
騰訊雲 Deep Seek 聯網助手
我個人覺得直答也好,上面其他產品也好,介面看上去很舒服。
但在雲控制檯突然很突兀的這麼設計和嵌入個 ChatBot 就有點違和(UI 元件不一致)。

等待回答

和現在爆滿的直答、老王版 DS速度差不多…因為這個排版設計,看起來有點費眼…(再次吐槽

生成結果

這個結果,怎麼說呢,如果我沒有看到上面的一眾結果,我會覺得還湊乎,但是我們看過了上面的結果,這個是最敷衍的結果,沒有之一…
先寫這麼多,我們再等子彈飛一飛。
知乎直答抓緊迭代,加油~
題圖來源:《社交網路》
知乎熱門文章

哪吒 2 票房已破 100 億!導演餃子曾經在知乎留下過這樣一段話

為什麼《哪吒之魔童鬧海》能成為中國影史票房冠軍?

近 9 成國人乳糖吸收不良,為何牛奶還是如此普及?

本文內容來自「知乎」
點選上方卡片關注
轉載請聯絡原作者
👇點選【閱讀原文】,看更多精彩回答

相關文章