作者
|summer
郵箱
面對DeepSeek給模型技術及應用模式帶來的新衝擊和挑戰,位元組的調整比以往更加迅速到來。
多位接近位元組的人士對矽星人透露,位元組的AI核心部門Seed正在快速調整定位和調兵遣將。剛剛從谷歌加入字節跳動的AI大牛、參與了Gemini開發的Google Fellow吳永輝博士,將成為Seed新的負責人,替換原LLM團隊及Seed總負責人朱文佳,團隊內部正在梳理調整彙報關係。
對此,矽星人向知情人士求證,對方稱:吳永輝博士主要負責AI基礎研究探索工作,偏基礎研究,朱文佳主要負責模型應用相關的工作,偏模型應用,兩個人都在Seed部門,都向梁汝波彙報。
不過,矽星人此前梳理Seed組織架構時發現,朱文佳負責Seed,現僅負責模型應用即便職級不變,但實際此次調整管理範圍收縮。
這一人事變動的時間點頗具深意。就在上週的內部全員會上,字節跳動CEO梁汝波剛剛反思了公司在AI領域的短板,對重大技術的跟進速度不夠。
整個2024年,位元組在應用層花費了大量功夫,在年末成功將豆包打造成了國內日活使用者最高的AI應用。但進入2025年,在經歷了DeepSeek R1的衝擊後,位元組開始意識到僅靠產品創新和流量優勢,已不足以在AI時代保持領先。
“位元組過去一年看起來豆包衝的比較兇,但豆包只是一個代號,背後大模型上的投入也很大,最後結果是語音模型發展得最好,而影片模型上和世界一流有一定差距,LLM發展一般,特別是沒趕上DeepSeek這波,這應該是吳永輝加入的關鍵原因。”一位知情者說道。
一切指向位元組對其AI業務組織架構的重新梳理,由吳永輝帶領的Seed顯然將聚焦模型基礎研發,不再與應用等混合在一起。
1
第一位回到國內大廠的矽谷大模型明星科學家,花落位元組
在加入字節跳動之前,吳永輝在谷歌工作了17年。據Google Research官網介紹,他於2008年9月加入谷歌,最初是一名搜尋排名工程師,負責改進谷歌的核心搜尋演算法。2014年,他轉向了當時方興未艾的深度學習領域,加入Google Brain團隊,在2023年與DeepMind團隊合併之後,成為了VP of Research,並被授予“Google Fellow”的稱號。
從研究領域來看,吳永輝的成果涉及機器翻譯、語音技術和大語言模型等多個領域。據谷歌學術顯示,2020年以來,吳的論文引用超過了4萬次。

其最著名的研究是在機器翻譯領域。2016年,吳永輝參與的谷歌神經機器翻譯系統(GNMT)是一個行業技術發展的關鍵節點——該系統首次將端到端深度學習引入翻譯引擎,透過多層LSTM網路結合注意力機制與殘差連線,使翻譯錯誤率較傳統短語系統降低60%。
GNMT背後,涉及到RNN、LSTM、Seq2Seq、Attention機制、 Beam Search、Encoder-Decoder架構等模型,在釋出之初,曾引起了語言服務市場上的一陣騷動,不僅讓漢英翻譯全面轉向神經網路架構,更推動谷歌翻譯日均處理量突破1800萬條,而後谷歌翻譯開始用神經網路翻譯提供9國語言的互譯。
在大模型的浪潮下,吳永輝另一個令人矚目的經歷是參與了Gemini系列模型的開發工作,包括Gemini Family和Gemini 1.5,推動了模型在長上下文理解、跨模態推理等方面的突破。
在參與大模型基礎研究方面, 吳永輝還在2022年的《GLaM: Efficient Scaling of Language Models with Mixture-of-Expert》中提到透過稀疏專家網路最佳化萬億引數模型訓練效率,相比傳統密集模型降低三分之二能耗,這項技術重塑了超大規模AI系統的工程正規化。
在影像生成模型領域,吳永輝則是參與開發了CoCa圖文基礎模型(2022年,引用1453次)等數個圖文模型;在語音技術領域,他參與開發的Conformer語音識別架構(2020年,引用3575次)和Tacotron端到端語音合成系統(2017年,引用2595次),主要聚焦於提升語音識別精度和簡化語音合成流程,並且在加入位元組前的2024年到2025年,他的研究重點基本集中在語音方向,包括更自然的語音合成、端到端語音系統和多語言語音合成等專案。
可以說,在 17 年的谷歌生涯中,吳永輝積累了橫跨多個細分研究領域的成果和經驗。即使在近兩年來國內外大模型人才戰十分密集,這樣一位從矽谷大模型大廠回國加入國內大模型大廠的明星科學家也並不多見。
回顧2023年以來,人才流動或在創業和大廠之間流動,或在國內、國外分隔流動,例如百度、阿里、位元組之間,谷歌、微軟、OpenAI之間,這也意味著,此前對國外大廠的科學家而言,國內大廠的機會不夠有吸引力,以及國內大廠向海外挖人需要高昂的代價。也正是因此,此次吳永輝從谷歌加入位元組,值得被視為一個新的節點。
1
位元組AI大轉向,從應用層開拓到模型層探索
此前,此前的位元組AISeed部門由朱文佳負責。朱文佳曾任百度搜索部主任架構師,2015年加入字節跳動,負責演算法工作,憑藉在演算法和搜尋領域的卓越能力,被譽為“頭條演算法技術Top 3”,而後先後擔任今日頭條CEO、TikTok產品技術負責人,直到2023年,朱文佳開始組建字節跳動大模型團隊,探索搜尋和廣告等業務應用,2024年晉升為直接向CEO梁汝波彙報的核心負責人。
“並不是說朱文佳做的不好,而是業務發展了2年,對位元組這種保持變化活力的公司來說,有變動非常正常。”一位知情者說道。
這或許與上週位元組的內部全員會有關。在會上針對AI業務,位元組CEO梁汝波反思了位元組對技術浪潮的錯失,並提出2025年的重點目標,其一就是,追求“智慧”上限,相比於追求某個具體產品——比如豆包的 DAU,把智慧本身作為最重要的目標可以激發更多嘗試、不忽略關鍵技術節點。
不久前,位元組還正式設立代號為“Seed Edge”的研究專案,核心目標是做比預訓練和大模型迭代更長期、更基礎的 AGI 前沿研究,專案員工考核週期放慢,過程指標考核也被放寬, 鼓勵探索更長週期、不確定的和大膽的課題。
將目標設為打破智慧上限,意味著位元組要繼續與世界一流的基礎大模型公司一較高低,顛覆了過去一年的“應用工廠”思路。而吳永輝的技術出身和經歷,更適合帶領位元組AI探索基礎模型的未來。
這不是位元組第一次反思自己錯過關鍵的技術節點。2024年年初,梁汝波就在內部反思“公司變遲鈍了”,忽視了以Transformer為核心的語言模型。於是,整個2024年,“效率至上”的位元組都在瘋狂追趕進度。
一方面,在人才儲備上面,原谷歌VideoPoet 的專案研究負責人、高階科學家蔣路、阿里通義千問大模型技術負責人周暢、零一萬物原聯合創始人和預訓練負責人黃文灝等相繼加入位元組等等;另一方面,在架構和產品上,在產品和模型層同時賽馬,向內部開放抖音的流量。
最終,位元組成功地讓豆包APP從吊車尾上漲到國內日活躍使用者第一的AI產品。直到這個春節,DeepSeek R1 釋出,在沒營銷的情況下,靠模型基礎技術的突破,輕描淡寫地將這一優勢打碎了。
去年下半年,國內開始了o1追逐賽之後,通義千問的Qwen QwQ、階躍星辰的R-mini,再到DeepSeek R1和Kimi 1.5都是推理模型,但位元組一直沒有推出相應的推理模型,並且至今豆包也沒有接入DeepSeek。至此,位元組開始反思第二次錯過,全員會上,梁汝波反思說去年 9 月 OpenAI 釋出長鏈思考模型,位元組 “沒有覺得要馬上覆現出來 。”
這種對關鍵節點的錯失和延遲的追隨,正在讓位元組變得不夠“位元組”。畢竟,在網際網路時代,位元組才是那把反應敏銳的創新尖刀。當下,所有人都在尋找AI時代的字節跳動,字節跳動自己似乎仍停留在網際網路模式裡。
此次找來谷歌AI核心人物,位元組AI必然會重新梳理AI路線和方法。不單純地躺在流量王國之上,走在技術創新的前列,正如梁汝波所說,“做科技公司還不夠,得做創新科技公司,不僅要應用好新技術,還要能探索、發明新技術。”
但這對位元組來說並不是一件容易的事。突破技術的邊界,和做最能洞察消費者的應用,是兩個邏輯。這需要位元組一定程度上跳出既有方法論和慣性,首先或許就是,要有更明確的技術思路,而不是靠賽馬測試。
