杭州/北京內推 | 阿里夸克基礎大模型團隊招收強化學習方向演算法工程師/實習生

合適的工作難找?最新的招聘資訊也不知道?
AI 求職為大家精選人工智慧領域最新鮮的招聘資訊,助你先人一步投遞,快人一步入職!
阿里巴巴
阿里巴巴夸克大模型團隊致力於全棧自研千億級引數大模型,聚焦搜尋、醫療、教育等場景的智慧化創新。團隊依託海量業務沉澱資料庫與搜尋技術優勢,打造低幻覺率、高知識正確性的AI能力。作為阿里戰略級創新業務核心力量,持續推動AI技術突破與場景落地。

強化學習演算法工程師/實習生
座標:杭州/北京
崗位職責
1. 研發新一代大模型強化學習演算法,提升大模型在多模態、工具呼叫、複雜環境互動、多智慧體互動等方向的基礎能力;
2. 改進大規模分散式強化學習框架,最佳化萬卡叢集下的高效分散式訓練效率,支援大模型與複雜環境/工具的高效互動; 
3. 將強化學習研究成果融入夸克產品生態,打造更懂使用者的智慧服務產品, 讓前沿技術惠及億萬使用者。
崗位要求
1. 碩士及以上學歷,數學、強化學習、自然語言處理等相關專業;
2. 在強化學習方面具有豐富的專業知識,熟練掌握深度強化學習演算法在大語言模型中的應用及前沿知識;
3. 熟悉大模型相關深度學習框架,如Transformers、PyTorch、Megatron-LM等,有紮實的程式設計基礎和程式碼實現能力;
4. 具備良好的溝通、協作和解決問題的能力,能夠與團隊成員密切合作,共同解決問題。
加分項
1. 有大語言模型RLHF、RL reasoning、Agentic RL等方向有實際專案參與經驗; 
2. 在強化學習、大模型訓練、多智慧體等研究方向在頂級學術會議上發表過論文; 
3. 有大規模分散式強化學習訓練經驗或RL框架最佳化經驗。
 投遞方式 
郵件標題註明:姓名-崗位名稱AI求職


加入社群  🌟
為了更好地瞭解和滿足大家的需求,我們建立了「求職者社群」
加入 AI 求職社群,你可以享有招聘需求曝光獲取最新面試經驗校招準備攻略碩博招生獨家內推渠道等服務。
掃描下方小助手的微信,pick 你心儀的崗位~

如何釋出招聘
AI 求職是「PaperWeekly」旗下聚焦人工智慧領域的招聘平臺,涵蓋高校碩博招生、博士後招募、企業校招、社招、實習和內推等。
目前已有百度、阿里、騰訊、字節跳動等企業釋出內推崗位,歡迎大家訂閱關注、釋出崗如果你也想對公司和在招職位進行更多曝光,請聯絡我們的欄目負責人(微信:pwbot02)。
·
·


相關文章