
1 月 23 日,據媒體報道,位元組豆包大模型團隊已在內部組建 AGI 長期研究團隊,代號“Seed Edge”,鼓勵專案成員探索更長週期、具有不確定性和大膽的 AGI 研究課題。接近位元組的知情人士透露,Seed Edge 的目標是探索 AGI 的新方法,代號名中 Seed 是豆包大模型團隊名稱,Edge 代表最前沿的 AGI 探索。Seed Edge 鼓勵跨模態、跨團隊合作,為專案成員提供寬鬆的研究環境,實行採用更長週期的考核方式,以保障挑戰真正顛覆性的 AGI 課題。同時,Seed Edge 也將得到單獨的算力資源保障。
根據披露,Seed Edge 初步確定了五大研究方向,包括探索推理能力的邊界、探索感知能力的邊界、探索軟硬一體的下一代模型設計、探索下一代 AI 學習正規化、探索下一個 scaling 方向。儘管業界不少團隊在討論是否應對 AI 預訓練和基礎研究繼續投入,位元組仍在以前所未有的戰略決心加碼大模型底層研究,包括提供充分的算力資源、廣泛網羅頂尖研究人才,並打造長期主義的研究環境。
去年 5 月,為儲備最具潛力的研究人才,豆包大模型團隊啟動了“Top Seed 人才計劃”,以極具競爭力的待遇在全球招募頂尖博士畢業生加入。成立短短數月內,豆包大模型團隊 57 篇論文中選 ICLR、CVPR、NeurIPS 等頂會,研究成果包括下載量超百萬的開源工作及 GitHub 萬星專案。同時,團隊與近 20 所高校展開合作,包括與清華 AIR、北大分別成立 AI 方向聯合實驗室。
就在昨天,位元組釋出了豆包大模型 1.5Pro 版本,目前,Doubao-1.5-pro 已在豆包 APP 灰度上線,接受海量請求效果出色,同時,開發者也可在火山引擎直接呼叫 API 。
據介紹,豆包大模型 1.5Pro 在知識 (MMLU_PRO、GPQA)、程式碼 (McEval、FullStackBench)、推理 (DROP)、中文 (CMMLU、C-Eval) 等多項公開測評基準上成績全球領先。位元組官方強調了新模型的以下特點:
豆包大模型 1.5Pro 使用較小的啟用引數進行預訓練,訓練成本極低,但效能不打折,採用大規模稀疏 MoE 架構,等效 7 倍啟用引數的 Dense 模型效能,遠超業內 MoE 架構約 3 倍槓桿的常規效率。
憑藉位元組自研伺服器叢集方案,靈活支援低成本晶片,硬體成本比行業方案大幅度降低。另外,位元組自研網絡卡和網路協議,顯著最佳化小包通訊效率,運算元層計算與通訊的高效交疊,保證了多機分散式推理的穩定和高效;透過精細量化和 PD 分離等方案,靈活使用算力和多工混合排程,實現更高效算力利用。
新版豆包視覺理解模型 Doubao-1.5-vision-pro,視覺理解能力全球領先。詳見文末表格。
全新的豆包即時語音模型 Doubao-1.5-realtime-voice-pro,採用 Speech2Speech 端到端框架,表現力實現質的飛躍,真正做到會哭會笑、能說方言會唱歌。
基於豆包 1.5 基座模型,透過 RL 演算法的突破和工程最佳化,在未使用其他模型資料的情況下,研發豆包深度思考模型。階段性進展 Doubao-1.5-Pro-AS1-Preview 在 AIME 上已取得了業內領先的成績。詳見文末表格。
所有模型訓練過程中,未使用任何其他模型生成的資料。 豆包大模型構建自主的資料生產體系,以標註團隊與模型 self play 技術相結合,高效最佳化資料質量,提升資料標註多樣性和難度,確保資料來源的獨立性和可靠性。
在 AI 大模型技術如洶湧浪潮席捲軟體開發領域的當下,變革與機遇交織,挑戰與突破共生。2025 年 4 月 10 – 12 日,QCon 全球軟體開發大會將在北京召開,以 “智慧融合,引領未來” 為年度主題,匯聚各領域的技術先行者以及創新實踐者,為行業發展撥雲見日。現在報名可以享受 8 折優惠,單張門票立省 1360 元,詳情可聯絡票務經理 18514549229 諮詢。
