
大家好,我是 Monica.im 的產品合夥人張濤。
相信大家和我一樣,整個春節期間幾乎都在抱著手機刷資訊。白天看國內的反應,晚上看美國的反應。整個春節就這樣度過了。春節後這一週,大家已經在各種微信公眾號和其他平臺上刷了大量關於 R1 的分析文章,從技術到產品、再到長遠影響的探討,很多群也在轉發聊天記錄,有關於 R1 的十幾篇必讀文章。
我和雨森(真格基金管理合夥人)商量說來做這個分享時,就明白很多資訊可能會過時。既然我們這麼多人在這裡,如果仍然講一些比較常見或者宏觀的資訊,是浪費大家的時間。
這一週我在準備過程中,一方面讓我司首席科學家 Peak 幫我審查了很多技術和演算法方面的細節。另一方面,在整合各方資訊時,我發現了一個特別有趣的敘事角度。
今天的分享,既是為了讓大家更好地理解 R1 背後的脈絡,也是希望大家看到這次精彩冒險背後一個美妙的故事。
好了,今天的分享正式開始。
01






02













03







04








05




06


接下來,我們進入今天的第二個高潮。
07



很多人覺得 MoE 模型很 low,認為大模型訓不下去了,訓一堆小模型,「三個臭皮匠,頂一個諸葛亮」。但 MoE 不是這樣。






08



第三點是,R1 + Search 之所以那麼火,根本原因是因為它本質上是一個非常簡單的 Agent Framework。R1 的推理模型再怎麼厲害,它依然只能停留在自己的腦內腦補,無法瞭解外部世界。
DeepSeek 這個表達本身沒有任何問題,而且他們在自己的文章裡也明確指出了不包含哪些費用。站在 DeepSeek 本身的角度來看,他們沒有做任何作假的事。

但事實上上面是 SemiAnalysis,這個結果是比較公允的。上圖左下角是 2022 年 10 月 7 日,美國第一次禁運,那時候 H800 可以買的。
再說一下蒸餾和偷竊。我本來準備了長篇大論,尤其是如果說是蒸餾,舉證責任應該在對方,不應該由我來回應。我不是專業人士,不能代表 OpenAI 或者 DeepSeek,做回應挺無力的。



熱點影片

更多閱讀



