編輯:杜偉
在 AI 時代的浪潮下,頂尖人才影響力空前高漲,其地位更被市場推升至了前所未有的高度。無論是谷歌 Transformer 論文八子,還是從 OpenAI 出走的科學家,他們要麼自立門戶,拿到億級投資、百億級估值,或者跳槽到他處,憑己之力拉近企業間的技術代差甚至影響競爭格局。
頂尖人才的供給增長速度似乎跟不上網際網路大廠、初創公司急劇膨脹的需求,因此擁有極強議價能力。企業為了招攬這些具備突破效能力、能引領方向或解決關鍵瓶頸的人才,使出了渾身解數。
這場看起來一時不會結束的人才軍備競賽,在國內同樣呈現出了高強度、系統性、全球化的競爭態勢。
網際網路大廠紛紛放大招,京東 TGT 頂尖青年技術天才計劃、位元組 Top Seed 人才計劃、騰訊青雲計劃、百度文心・新星計劃…… 各種行業 Top 薪酬甚至薪酬不設上限,鈔能力拉滿,誓要將頂尖人才收入麾下。
企業與人才雙贏的實現,需要“雙向奔赴”。
最近,一場聚集了產業技術大佬和高校技術天才的線下技術沙龍上,我們聽到了他們對於前沿技術方向的深度探討和雙方對技術人才發展共同的思考和期待。

京東技術沙龍零售專場
這是今年 5 月全球啟動的 “京東技術沙龍” 活動的最後一場,多位京東零售內部大模型相關技術團隊負責人來到現場,與大家分享頂會論文和真實場景案例,展示最新前沿技術進展與創新應用實踐的融合。
來自核心技術部門的青年技術專家也以學長學姐的身份向同學們傳授經驗、分享心得,幫助大家快速瞭解京東豐富的業務場景、以及如何找到自己最適配的團隊和崗位。
如何從新人快速成長為技術骨幹,實現從學界研究到產業實踐的角色轉變?懷揣著和現場同學們一樣的好奇心,我們與來自京東零售產研的 5 位青年技術專家聊了聊,他們中最大不過 92 年、最小 98 年。他們的經歷,也許可以為即將踏入職場的新人提供一些參考和借鑑。
1 年期新人通關:
實驗室到業務前線,克服畏難心理啃下硬骨頭
洛川,一位剛滿 27 歲的大男生。
2024 年,在取得中國科學技術大學計算機軟體與理論博士學位之後,他加入了零售 AI Infra 團隊。
與所有初入職場的同學一樣,從校園到職場,洛川充滿忐忑。
但全方位的支援體系,徹底打消了他的擔憂。
洛川有兩位業務 + 技術導師,每個月他們都會抽出時間找他一起聊一聊,無論是個人成長方面的疑慮,還是技術層面的困惑。很快,洛川開始系統性地熟悉所在部門的技術棧、程式碼庫,並逐漸適應 AI Infra 團隊的工作節奏。

迅速融入的洛川(左 3)和夥伴們一起團建
幾個月後,已經順利渡過新人階段的洛川迫切地希望將自己博士期間的研究成果真正服務於實際問題。「以往的研究大多停留在論文層面,而京東擁有豐富業務場景和海量產業資料,讓我的研究終於有了規模化應用的機會。」
初步熟悉業務之後,洛川開始主動思考自己所在技術領域存在的痛點。他所在的團隊主要負責構建和最佳化支撐大規模 AI 應用的基礎設施,涵蓋叢集管理、算力排程、資料與樣本中心建設、訓練與推理引擎最佳化等。
過程中,透過自己對京東電商平臺的長時間觀察以及導師的指導,洛川明確了想要突破的目標。
他發現,進入大模型時代以來,推薦領域開始利用 Scaling Law 帶來增益。不過,隨著推薦模型中稀疏引數規模的持續增長,加上像京東這種電商平臺中使用者行為序列往往長達數萬甚至十萬,這些引數的儲存、通訊以及查詢開銷成了大規模點選率預測(CTR)模型分散式訓練的瓶頸,影響到了演算法團隊的迭代效率。
面對這一難題,洛川躍躍欲試。在瞭解業務團隊的核心訴求並精準定位技術難點之後,他迅速投入,分析了學術界和工業界現有方案並著手製定適合業務場景的技術規劃和可行落地方案。
很快,他和團隊一起設計並實現了一套重要性感知的量化與快取方案,該方案顯著減少了稀疏引數的儲存、通訊和查詢開銷,大幅加速 CTR 模型的分散式訓練程序。看到實際效果落地,洛川深感「自己的辛苦沒有白費。 」
這只是洛川這一年來的一個縮影,如今的他已經找準了自己的定位,與 AI Infra 團隊一道攻克一個又一個技術難題。「作為新人,要克服畏難心理,深入一個領域,勇於啃下硬骨頭。」
3 年期進階通關:
瞄準真實痛點,從被動解題到主動提出問題
“一年級” 職場新人洛川的經歷,在他的兩位前輩謙屹和田野看來似曾相識。
謙屹和田野 3 年前從中科院自動化所博士畢業後便加入了京東。
謙屹專注於影像生成、多模態大語言模型、OCR 等計算機視覺研究。田野專注於搜尋相關性業務,以及 NLP 技術在搜尋場景的落地。加入京東後分別入職廣告產研部和搜推技術部。
當他們前後腳加入京東時,還是遇到了不同的挑戰和問題。
田野稱自己需要克服的最大挑戰是實驗室思維到企業工程師思維的轉變,這源於不同環境下問題定義與資料體系的根本性差異。
實驗室環境下的研究通常針對明確定義的任務進行:問題本身、應用場景以及訓練集和測試集都是預先給定且相對固定的,目標聚焦於在特定資料集上提升指標。而在真實的工業級電商搜尋場景中,業務的核心問題會隨著發展階段快速變化;同時,工業場景中不存在現成的標準資料集,要求工程師自主構建整個資料閉環。
這種轉型並不容易,「我要逼自己從純粹的解題者轉變為具備持續業務洞察力、能動態定義核心問題並自主構建適配資料與評估體系的問題定義者 + 架構師。」
田野花了很長一段時間才適應了新角色。此後,他便開始如魚得水,利用自己的專業知識深度參與到搜尋場景的體驗升級。在跑演算法、訓大模型的過程中,田野最擔心顯示卡不夠用,但京東內部提供了一套靈活的資源傾斜策略,對長期有價值的專案全力支援。田野受到了很大的鼓舞,「如今在算力資源上得到了保證,自己也就再無後顧之憂,可以放手去研究生成式搜尋技術了。」
而謙屹剛入職時最直觀的感受是,原本以為自己積累了深厚的技術底子,但在工業界,業務需求與技術迭代的速度太快,原有的知識與技能面就顯得窄了。
好在,他可以直接面向實際應用場景,對業務痛點進行最直接、最深刻的體察。謙屹特別提到了自己參與的一項電商廣告圖片生成創新工作 —— 基於人類反饋的可信賴影像生成(RFNet +RFFT),在豐富人類稽核資料的基礎上,利用 RLHF 技術,透過 RL 演算法將人類偏好反饋給生成模型,有效降低了商品形變、背景錯位等問題的發生機率,提升了模型生成可用圖片的能力。

RFFT 相較其他方法實現了 SOTA [1]
謙屹開始慢慢跳出過去深耕的垂直領域,技術視野變得更廣,掌握的更多知識和技能可以輕鬆應對多元化業務的挑戰。
短短三年,他發表了 10 餘篇創新性科研成果,並被多個 AI 頂會以及 AI 頂刊收錄。目前,他與團隊正積極探索前沿生成式 AI 能力對廣告創意生成的賦能,尤其是多模態大模型批次化和自動化創意生產。
無論是田野還是謙屹,他們瞄準千萬消費者和商家的真實體驗痛點,在應對和解決業務挑戰中獲得了快速的成長和收穫。
95 後向前一步:
敢想、敢為,探索多種可能性
其實在京東零售技術團隊中,還有很多類似的年輕演算法工程師們,95 後的長林和島嶼就經常和前面 3 位一起交流、切磋技術問題。
長林研究的方向是大模型蒸餾和資料選擇,側重低資源情況下大模型的訓練與規模化應用,由於現代深度學習與大模型的成果依賴海量資料、巨大引數規模和高昂算力成本,使得低資源訓練極具挑戰。「學術訓練的核心在於將現實問題簡化、抽象為邊界清晰的數學問題求解,但現在面對的問題不是孤立的知識點,而是技術、業務、資源、人員交織的系統」。
肯定不能「拿著錘子找釘子」的生搬硬套,長林開始積極請教周圍熱情的導師、前輩、學長學姐,與他們面對面交流、探索的過程中他們給了長林很大的自由度與耐心,「不要怕,達成目標的手段並不唯一,要敢想、敢為、探索多種可能性,我們來兜底」,這是他經常聽過的鼓勵與鞭策。
他提出僅選擇資訊最豐富的樣本子集進行訓練,以在模型效能和訓練效率之間取得更好平衡。最終證明,在平均僅取樣 70%-80% 資料的情況下,模型精度能夠保持與原模型相當,且優於其他資料選擇方法。

透過資料選擇突破冪率的 Scaling Law [2]
近期,長林的三篇論文分別被頂會 ICLR、AAAI 和 ACL 接收,還提交了 8 項專利,可謂收穫滿滿。其中一項代表性工作是基於動態資料選擇加速模型訓練。
同樣 95 後的島嶼,她的工作重點在大語言模型的產品化應用。在電商場景中,透過大模型生成文案,幫助使用者選購、為使用者提供專業商品建議。傳統模型更注重語言的高效和準確,而 95 後的她認為,要讓使用者真正逛起來,語言提供的情緒價值同樣重要,於是她提出同時考慮大模型的語言風格,豐富個性化的語言表達以適配不同的使用者需求,這個建議一提出就在內部獲得認可,團隊也配合她一起更新了方向和規劃,這讓島嶼備受鼓舞,「在這裡,溝通沒有門檻,行業大佬會直接參與和指導專案,能提升使用者體驗,就是第一優先順序。」
自由的思想碰撞 × 紮實的工程實踐 × 包容的成長環境,讓這些 95 後們能充分追求自己熱愛的技術方向。能跳出自身固有角色去主動思考問題、提出建議,創造力得到了充分激發。
人才建設,非一時之功
從高校實驗室邁入到覆蓋億級使用者的京東零售大環境,從碩博生轉換為企業工程師,幾位青年技術專家的成長之路走得很穩,技術帶來的能量得以發揮最大的價值。

技術沙龍上,青年技術專家與同學們交流
京東希望能為更多像他們一樣的青年技術人才,提供科技溫度和產業厚度共同構築的成長熱土,讓更多年輕人在這裡加速成長、施展才華、定義未來。
2017 年起,京東就啟動了面向青年技術人才的 “博士管培生專案”, 一批優秀的技術人已經迅速成長為各個技術板塊的核心骨幹,今年 5 月 8 日再次加磅,啟動了京東 TGT 頂尖青年技術天才計劃,該計劃面向全球高校本碩博畢業生以及畢業兩年內的技術人才,薪酬「不設上限」,涵蓋了八大研究方向:多模態大模型與應用、機器學習、搜尋推薦廣告、空間與具身智慧、高效能與雲計算、大資料、AI Infra 以及安全等。
對人才吸引的誠意與決心,以及更加立體的人才培養模式、多維度又專業化的指導,京東希望進一步為人才成長提供成長保障,持續最佳化的人才梯度建設也將不斷為京東及其業務賦能。
未來,這支融合了前沿探索精神和實戰經驗的年輕化技術軍團,不僅更能貼近新生代使用者與市場的思維,還將繼續驅動京東在 AI、大資料、雲計算等核心領域的創新與突破,構築起難以複製的技術競爭力護城河。
最後,點選“閱讀原文” 直達 “京東 TGT 頂尖青年技術天才計劃” 進行投遞,一起用技術創造更多美好吧!
參考連結:
[1] 論文地址:https://arxiv.org/pdf/2408.00418
[2] 論文地址:https://openreview.net/pdf?id=7oPAgqxNb20
© THE END
轉載請聯絡本公眾號獲得授權
投稿或尋求報道:[email protected]