晚點播客丨MiniMax閆俊傑聊大模型2024:一個非共識判斷引起的回聲

“更好的模型可以導向更好的應用,但更好的應用和更多使用者並不會導向更好的模型。”
文丨程曼祺
* 頭圖:Dota 2019 國際邀請賽決賽(TI9)中,OG 戰隊的 Ana 使用 IO(小精靈,圖中球形發光體)的經典作戰,OG 在 TI9 中奪冠。為什麼用這個圖?播客裡有答案。
▲掃描上圖中的二維碼,可收聽播客。《晚點聊 LateTalk》#99 期節目。歡迎在小宇宙、喜馬拉雅、蘋果 Podcast 等渠道關注、收聽我們。
《晚點聊 LateTalk》是《晚點 LatePost》 推出的播客節目。“最一手的商業、科技訪談,最真實的從業者思考。”
上週四,我們釋出圖文訪談:《晚點對話 MiniMax 閆俊傑:千萬別套用移動網際網路的邏輯來做 AI》,這是這次訪談的音訊版。
閆俊傑的一些 “非共識” 判斷,引起不少討論。
他認為,模型能力和使用者規模並不是直接的飛輪關係:“更好的模型可以導向更好的應用,但更好的應用和更多使用者並不會導向更好的模型。”
而今天(1 月 22 日)字節跳動釋出 Doubao-1.5-pro 模型的技術報告裡則提到:“依託位元組在推薦、搜尋和廣告領域的 AB Test 經驗,研發了基於使用者反饋的高效 PostTraining 全流程……透過使用者資料飛輪持續提升模型的實際使用體驗。”
「亂翻書」主理人潘亂 1 月 21 日時也預告,他將錄一期播客,“就聊能不能套用移動網際網路邏輯來看 AI?”
有聽友在既看了圖文訪談、又聽了播客後說:“看文字和聽聲音感覺還是很不一樣。”
其實從使用者規模上來說,MiniMax 在大模型創業公司中是相對領先的:它的 AI 社群產品 Talkie 的最新月活使用者數已超 Character.ai,成為同類產品全球第一;其在中國的 AI 社群產品 “星野”,使用者數、使用時長和留存率也都是第一,高於位元組旗下的同類產品。它在去年 8 月底推出的影片生成平臺海螺 AI,目前也是全球訪問量最高的影片生成網站。
閆俊傑為什麼要自己推翻自己的優勢?聽聽他自己怎麼說吧。
內容要點
聊 MiniMax-01 新模型系列:為什麼開源?
02:12 為什麼開源——加速技術迭代 & 加強技術品牌
08:22 行業誤區:認為更好的智慧水平要依賴更多的使用者;其實不然
13:01 想清楚這個邏輯後:模型要追求不斷提高上限,而產品就是產品
15:11 明確 MiniMax 是一家技術驅動的公司
聊對技術的態度:“一年前最喜歡說信仰的人,信仰都兌現了嗎?”
18:01 “隨熱點而動?” 這是對我們的誤解
20:13 現在沒人能定義什麼是 AGI,只能定義智慧水平會不斷進步
22:00 作為創業者,不是說 Scaling Law 撞牆了我就放棄了,而是努力找方法延續它
23:59 一年前最喜歡說信仰的人,信仰都兌現了嗎?
聊 Agent:long-context 很重要,探索 coding 之外的 Agent 場景
25:31 Agent 能處理複雜任務,複雜任務指在專業領域達到專業人士水平
27:51 Agent 需要模型架構和能力的提升;MiniMax-01 做到了第一點
29:08 01 改傳統 Transformer 裡的非線性注意機制為線性注意力機制,提升了處理 long-context 的能力,這對單 Agent 互動質量,和多 Agent 通訊都很重要
35:07 為什麼沒發 o1 方向模型?
39:40 多模態能力在 OpenAI L1-L5 的 AGI 路線圖裡很重要
41:04 AI 程式設計助手 Cursor 的成功並不基於 o 方向的模型
41:51 蒸餾 o1 資料復現 o1,沒那麼難
44:09 程式設計之外另一 Agent 落地場景:資訊的獲取
51:09 中美模型的一個區別,前者缺少內部 benchmark
55:19 MiniMax 的技術團隊特點:模型、Infra 和工程的綜合能力強;客觀、扁平、靈活
聊模應一體:市場不是有 A,就不能有 B
01:01:38 模型、應用一起做,還有必要嗎?
01:03:59 即使更晚創業,也不會做只做應用的公司,因為想做基於未來技術的產品
01:04:44 海螺文字的失利——沒有堅持技術驅動
01:06:48 Talkie、星野的暫時領先——因為更懂使用者
01:07:34 做技術的人大部分覺得自己很牛,但我不是這麼認知世界的
聊競爭:不要區分大廠和創業公司
01:07:56 不用把創業公司單獨當一類公司
01:09:22 DeepSeek 也很純粹;智譜第一個有 AI 路線圖
01:09:59 MiniMax 的路線圖?——逃出生天,下一步最重要
01:11:19 一年來大模型競爭最大的變化:更多人意識到這和移動網際網路是兩件事
01:12:29 沒和位元組談過被收購,從來沒想過把公司賣一個什麼價錢
01:15:02 24 年沒完成年初目標,定目標的邏輯就不太對
01:16:28 大廠投入和競爭激烈程度都在預料之內
01:18:46 AI 產品該看什麼指標?
01:20:25 大公司之外,更大的 “危險” 還是來自自己的認知
聊團隊和自己:放下 ego,深度思考
01:22:49 不要假定團隊沒有流失,流失才是正常的
01:23:24 MiniMax 需要的兩種人
01:25:48 確定研發優先順序需要做取捨,不見得每個取捨都對,糾錯很重要
01:26:56 CEO 決策什麼不決策什麼不重要,重要的是組織有共同決策標準
01:29:48 讓所有人都覺得公司被管得很好,這不是一個目標
01:30:28 打造 AI 組織的難點:持續吸引更好的人
01:31:17 半年多前焦慮,現在不了,因為已做出取捨,以技術迭代為最大目標
01:32:08 去年反思最多的問題——認知能力為何不能提升得更快?
01:32:16 放下自我,思考得更深入
01:34:29 為什麼一直被叫 IO?
01:36:38 25 年對自己的期待:不斷提高技術水平
·  FIN  ·


相關文章