晚點播客丨MiniMax閆俊傑聊大模型2024：一個非共識判斷引起的回聲

“更好的模型可以導向更好的應用，但更好的應用和更多使用者並不會導向更好的模型。”

文丨程曼祺

* 頭圖：Dota 2019 國際邀請賽決賽（TI9）中，OG 戰隊的 Ana 使用 IO（小精靈，圖中球形發光體）的經典作戰，OG 在 TI9 中奪冠。為什麼用這個圖？播客裡有答案。

▲掃描上圖中的二維碼，可收聽播客。《晚點聊 LateTalk》#99 期節目。歡迎在小宇宙、喜馬拉雅、蘋果 Podcast 等渠道關注、收聽我們。

《晚點聊 LateTalk》是《晚點 LatePost》推出的播客節目。“最一手的商業、科技訪談，最真實的從業者思考。”

上週四，我們釋出圖文訪談：《晚點對話 MiniMax 閆俊傑：千萬別套用移動網際網路的邏輯來做 AI》，這是這次訪談的音訊版。

閆俊傑的一些 “非共識” 判斷，引起不少討論。

他認為，模型能力和使用者規模並不是直接的飛輪關係：“更好的模型可以導向更好的應用，但更好的應用和更多使用者並不會導向更好的模型。”

而今天（1 月 22 日）字節跳動釋出 Doubao-1.5-pro 模型的技術報告裡則提到：“依託位元組在推薦、搜尋和廣告領域的 AB Test 經驗，研發了基於使用者反饋的高效 PostTraining 全流程……透過使用者資料飛輪持續提升模型的實際使用體驗。”

「亂翻書」主理人潘亂 1 月 21 日時也預告，他將錄一期播客，“就聊能不能套用移動網際網路邏輯來看 AI？”

有聽友在既看了圖文訪談、又聽了播客後說：“看文字和聽聲音感覺還是很不一樣。”

其實從使用者規模上來說，MiniMax 在大模型創業公司中是相對領先的：它的 AI 社群產品 Talkie 的最新月活使用者數已超 Character.ai，成為同類產品全球第一；其在中國的 AI 社群產品 “星野”，使用者數、使用時長和留存率也都是第一，高於位元組旗下的同類產品。它在去年 8 月底推出的影片生成平臺海螺 AI，目前也是全球訪問量最高的影片生成網站。

閆俊傑為什麼要自己推翻自己的優勢？聽聽他自己怎麼說吧。

內容要點

聊 MiniMax-01 新模型系列：為什麼開源？

02:12 為什麼開源——加速技術迭代 & 加強技術品牌

08:22 行業誤區：認為更好的智慧水平要依賴更多的使用者；其實不然

13:01 想清楚這個邏輯後：模型要追求不斷提高上限，而產品就是產品

15:11 明確 MiniMax 是一家技術驅動的公司

聊對技術的態度：“一年前最喜歡說信仰的人，信仰都兌現了嗎？”

18:01 “隨熱點而動？” 這是對我們的誤解

20:13 現在沒人能定義什麼是 AGI，只能定義智慧水平會不斷進步

22:00 作為創業者，不是說 Scaling Law 撞牆了我就放棄了，而是努力找方法延續它

23:59 一年前最喜歡說信仰的人，信仰都兌現了嗎？

聊 Agent：long-context 很重要，探索 coding 之外的 Agent 場景

25:31 Agent 能處理複雜任務，複雜任務指在專業領域達到專業人士水平

27:51 Agent 需要模型架構和能力的提升；MiniMax-01 做到了第一點

29:08 01 改傳統 Transformer 裡的非線性注意機制為線性注意力機制，提升了處理 long-context 的能力，這對單 Agent 互動質量，和多 Agent 通訊都很重要

35:07 為什麼沒發 o1 方向模型？

39:40 多模態能力在 OpenAI L1-L5 的 AGI 路線圖裡很重要

41:04 AI 程式設計助手 Cursor 的成功並不基於 o 方向的模型

41:51 蒸餾 o1 資料復現 o1，沒那麼難

44:09 程式設計之外另一 Agent 落地場景：資訊的獲取

51:09 中美模型的一個區別，前者缺少內部 benchmark

55:19 MiniMax 的技術團隊特點：模型、Infra 和工程的綜合能力強；客觀、扁平、靈活

聊模應一體：市場不是有 A，就不能有 B

01:01:38 模型、應用一起做，還有必要嗎？

01:03:59 即使更晚創業，也不會做只做應用的公司，因為想做基於未來技術的產品

01:04:44 海螺文字的失利——沒有堅持技術驅動

01:06:48 Talkie、星野的暫時領先——因為更懂使用者

01:07:34 做技術的人大部分覺得自己很牛，但我不是這麼認知世界的

聊競爭：不要區分大廠和創業公司

01:07:56 不用把創業公司單獨當一類公司

01:09:22 DeepSeek 也很純粹；智譜第一個有 AI 路線圖

01:09:59 MiniMax 的路線圖？——逃出生天，下一步最重要

01:11:19 一年來大模型競爭最大的變化：更多人意識到這和移動網際網路是兩件事

01:12:29 沒和位元組談過被收購，從來沒想過把公司賣一個什麼價錢

01:15:02 24 年沒完成年初目標，定目標的邏輯就不太對

01:16:28 大廠投入和競爭激烈程度都在預料之內

01:18:46 AI 產品該看什麼指標？

01:20:25 大公司之外，更大的 “危險” 還是來自自己的認知

聊團隊和自己：放下 ego，深度思考

01:22:49 不要假定團隊沒有流失，流失才是正常的

01:23:24 MiniMax 需要的兩種人

01:25:48 確定研發優先順序需要做取捨，不見得每個取捨都對，糾錯很重要

01:26:56 CEO 決策什麼不決策什麼不重要，重要的是組織有共同決策標準

01:29:48 讓所有人都覺得公司被管得很好，這不是一個目標

01:30:28 打造 AI 組織的難點：持續吸引更好的人

01:31:17 半年多前焦慮，現在不了，因為已做出取捨，以技術迭代為最大目標

01:32:08 去年反思最多的問題——認知能力為何不能提升得更快？

01:32:16 放下自我，思考得更深入

01:34:29 為什麼一直被叫 IO？

01:36:38 25 年對自己的期待：不斷提高技術水平

· FIN ·

dignews.cc

晚點播客丨MiniMax閆俊傑聊大模型2024：一個非共識判斷引起的回聲

相關文章

DeepSeek推出後，移動端AI風向要變

從手機PC到汽車AIoT，DeepSeek卷爆端側AI

斯坦福456頁AI報告劃重點：中美AI競爭格局變了！

AI衝擊！嵌入式開發如何轉型？嵌入式開發者必看

DeepSeek，又殺瘋了！

集齊了「鴻蒙」和「DeepSeek」兩顆「龍珠」，深思考給出端側AI「深度思考」

炸裂！AI大模型徹底爆了

贏麻了！全體程式設計師徹底狂歡吧！這個好訊息來得太及時！

抱歉，勸各位做好一年內隨時失業的準備！

黃仁勳變身美隊，皮衣開光追，最強卡皇5090登場，全世界玩家都瘋狂了