
MLNLP 2025學術研討會 是由 MLNLP社群、中國中文資訊學會青年工作委員會 和 中國中文資訊學會大模型與生成專業專委會 聯合舉辦的學術活動。社群會定期舉辦學術研討會並邀請國內外機器學習與自然語言處理領域知名青年學者進行報告交流,旨在加強國內外學者之間的交流。
MLNLP社群將在04月27日於線上舉辦第三十次學術研討會,由中國人民大學的朱餘韜博士後和北京師範大學的朱倩男講師共同擔任本期程式委員會主席。本期研討會分為上下兩半場:上半場由朱餘韜主持;下半場由朱倩男主持。具體而言,社群很榮幸邀請到中國人民大學教授竇志成老師擔任大會主席,並做開場致辭;加州大學博士後顧佳宸,蒙特利爾大學博士生莫馮然,耶魯大學副研究科學家謝倩倩,中國人民大學博士生李曉熙做專題報告。
會議概況
-
召開時間:
-
2025年04月27日 9:00-11:10(北京時間)
-
主辦單位:
-
MLNLP社群
-
中國中文資訊學會青年工作委員會
-
中國中文資訊學會大模型與生成專業專委會
-
大會主席:
-
竇志成:中國人民大學教授
-
程式委員會主席:
-
朱餘韜:中國人民大學博士後
-
朱倩男:北京師範大學講師
-
組委會:
-
MLNLP社群秘書處(劉洪宇、段然、陳麒光、鹿純林、李勤政、周璟軒)
-
直播平臺:
-
嗶哩嗶哩:http://live.bilibili.com/23872620
-
微信影片號:請點選下方卡片預約
日程安排

嘉賓介紹
一、大會主席:

竇志成
中國人民大學教授
嘉賓簡介:竇志成,教授,博導,中國人民大學高瓴人工智慧學院副院長,中國計算機學會大資料專家委員會秘書長,中國中文資訊學會理事、資訊檢索專委會副主任。主要研究方向為智慧資訊檢索、大模型以及二者的融合,曾獲教育部自然科學獎一等獎、國際資訊檢索大會(SIGIR 2013)最佳論文提名獎,WWW 2023亮點論文獎,亞洲資訊檢索大會(AIRS 2012)最佳論文獎,全國資訊檢索學術會議(CCIR 2018、CCIR 2021)最佳論文獎。擔任SIGIR 2019的程式委員會主席(短文),資訊檢索評測會議NTCIR-16程式委員會主席等職務。
二、主持人:

朱餘韜
中國人民大學博士後
嘉賓簡介:朱餘韜,中國人民大學高瓴人工智慧學院博士後,合作導師為竇志成教授。CIPS青工委成員,CCIR專委會委員。研究方向為資訊檢索與大語言模型。2023年畢業於蒙特利爾大學並獲博士學位。博士期間曾獲谷歌卓越博士生獎學金。目前,在人工智慧和資訊檢索領域的國際頂級期刊和會議上發表學術論文30餘篇。擔任多個國際學術會議如ACL、NeurIPS、ICML、ICLR、WWW、KDD、SIGIR的程式委員會委員,併為ACM TOIS、JASIST、KAIS等國際學術期刊的審稿人。

朱倩男
北京師範大學講師
嘉賓簡介:朱倩男,北京師範大學人工智慧學院講師,CIPS青工委成員,入選全球AI華人女性青年學者Top-80。2021至2023年中國人民大學高瓴人工智慧學院博後,師從竇志成教授。現在北京師範大學人工智慧學院黃華教授團隊,主要從事資訊檢索、推薦系統、教育大模型及相關教育應用等領域的研究工作。近幾年以第一作者和主要作者身份發表近20餘篇高質量的學術期刊和會議論文,包括IEEE TKDE、WWW、AAAI、IJCAI、CIKM、WSDM等。任多個國際學術會議和期刊審稿人。同時以負責人身份主持國家自然科學基金(面上、青年基金、博後站中)等多項專案。
三、分享嘉賓:

顧佳宸
加州大學博士後
嘉賓簡介:顧佳宸,加州大學洛杉磯分校計算機系博士後,師從Nanyun (Violet) Peng教授和Kai-Wei Chang教授,研究方向涵蓋檢索增強語言模型和知識編輯等領域。他以第一作者獲得ACL 2023 Best Paper Honorable Mention Award,以第二作者獲得DialDoc@ACL 2022 Best Paper Award。他是中國中文資訊學會優秀博士論文提名獎和中國科學院院長獎學金獲得者。個人主頁:https:// jasonforjoy.github.io/
報告題目:自適應路由檢索增強:知識言語化下的選擇性檢索
報告簡介:選擇性檢索透過減少低質量檢索帶來的干擾並提高效率,提升了檢索增強生成(RAG)的效能。然而,現有方法未能充分利用大語言模型(LLM)固有的知識,導致檢索決策次優,並影響生成效能。為彌補這一缺陷,我們提出了一種新的框架——自適應路由RAG(Self-Routing RAG),將選擇性檢索與知識言語化結合。Self-Routing RAG 使 LLM 能夠動態決定是依賴外部檢索還是利用其自身的引數化知識進行言語化表達。為此,我們設計了一種多工目標,對 LLM 進行聯合最佳化,包括知識源選擇、知識言語化和回覆生成。此外,我們引入基於近鄰搜尋的動態知識源推理,以提高在領域遷移情況下的知識源決策準確性。使用Self-Routing RAG 微調三種 LLM 後,其回覆準確性和推理延遲均得到顯著提升。與最強的選擇性檢索基線相比,Self-Routing RAG將檢索次數減少 29%,同時提升效能 5.1%。

莫馮然
蒙特利爾大學博士生
嘉賓簡介:莫馮然,加拿大蒙特利爾大學計算機科學與運籌學系博士研究生,師從ACM SIGIR Academy聶建雲教授,研究方向涵蓋資訊檢索,對話式AI系統,多語言NLP等。他已在人工智慧頂級會議發表論文二十餘篇,擔任多個國際學術會議如ACL、SIGIR、WWW、CIKM、EMNLP等的程式委員會委員與領域主席,併為ACM TOIS、CSUR等國際學術期刊的審稿人,曾獲WWW 2023亮點論文獎和EMNLP 2024最佳資源論文獎。
報告題目:基於大語言模型的對話式搜尋系統
報告簡介:大語言模型的發展逐漸改變著人們獲取資訊的方式與習慣,即從傳統的單輪搜尋轉變為與系統不斷互動的多輪搜尋。對話式搜尋系統透過基於自然語言的多輪互動實現使用者對複雜和準確的資訊訪問需求,其主要難點為需要從複雜的多輪對話中準確解讀使用者意圖。構建基於大語言模型的對話式搜尋系統的核心在於兩個關鍵元件:檢索模組和生成模組。針對檢索模組的構建,我們提出了ChatRetriever,繼承了大型語言模型強大的泛化能力,能夠穩健地表示覆雜的對話會話,從而實現稠密檢索(Dense Retrieval)。進一步的,針對生成模組的構建,我們提出了UniConv,探討了如何在對話中統一基於大語言模型的密集檢索和響應生成。我們期待透過這次分享,與社群一起推動結合資訊檢索的大語言模型領域的研究和持續進步。

謝倩倩
耶魯大學副研究科學家
嘉賓簡介:謝倩倩,耶魯大學副研究科學家,主要研究方向為自然語言處理以及其在醫學和金融領域的應用。她曾在康奈爾大學、曼徹斯特大學和蒙特利爾大學工作和訪問。她在國際頂級會議NeurIPS/ACL/EMNLP/NAACL/KDD/SIGIR /WWW /ICDM/COLING和國際頂級期刊Nature Communications/npj Digital Medicine /TOIS/TKDE等發表了50餘篇論文。她曾擔任 ACL 2023、EMNLP 2023、ACL 2025和COLING 2025 的領域主席,擔任 FinNLP-FNP-LLMFinLegal@COLING-2025 研討會的大會聯合主席,同時也是 FinNLPAgentScen@IJCAI-2024 和 BioNLP@ACL 2023 研討會所舉辦的share task的組織者。她長期擔任NeurIPS /ICLR/ICML/ACL/EMNLP/NAACL/KDD/ npj Digital Medicine等會議和期刊的審稿人。她曾獲得美國國立衛生研究院支援青年科學家的最高獎項之一NIH K99/R00 Pathway to Independence Award和CCL 2024亮點英文論文獎。個人主頁:https://qianqian-xie.github.io
報告題目:面向垂直領域的大語言模型落地應用:基準、模型、智慧體與應用
報告簡介:大語言模型在金融、醫學和法律等專業領域的應用潛力正日益凸顯,但要有效推動大語言模型在這些領域的真正落地,必須具有完善的專業評測基準、專業化的模型及穩健的評估框架。在這次報告中,我將探討實現這些高專業度領域AI 落地的四大關鍵要素,並分享 我們在推動這些方向上的探索與實踐。首先,我將介紹 FinBen—面向金融領域的大語言模型評測基準,覆蓋 42 個數據集、24 項金融任務,並融入智慧體交易評估和檢索增強式生成等前沿方法,全方位衡量模型的表現。接下來,我將分享 Open-FinLLMs,一系列針對金融自然語言處理、預測與決策最佳化的領域大語言模型,旨在提升對複雜金融語境的理解與推理能力。隨後,我將聚焦 FinCon ,面向金融決策任務的多智慧體系統,展示其在強化金融推理和協作決策中的應用價值,助力模型在真實金融場景中更為高效地處理高維度、多變數資料。最後,我會介紹 HARMONIC,面向隱私保護的資料合成框架,為安全合規的 AI 部署提供了關鍵保障,幫助模型在保護敏感資訊的同時實現持續迭代與創新。報告將結合我們在這些方向上所積累的經驗與成果,探討未來領域專用大語言模型的發展趨勢例如多模態學習和多語種適配,以及多智慧體在真實應用場景中的廣闊前景。我們期待透過本次分享,與更多研究者和從業者共同推進大語言模型在專業領域的持續演進與深度落地。

李曉熙
中國人民大學博士生
嘉賓簡介:李曉熙,中國人民大學高瓴人工智慧學院博士研究生,師從竇志成教授指導,研究方向涵蓋檢索增強生成和大語言模型推理等領域。他在頂級會議和期刊如AAAI,SIGIR,TOIS等發表多篇論文。
報告題目:WebThinker:賦予類o1推理模型深度研究能力
報告簡介:推理模型如OpenAI-o1、Qwen-QwQ在複雜的推理任務中表現突出,但存在知識不足的明顯缺陷。本次報告將依次分享兩篇工作,探討如何深度結合“推理過程”與“外部知識搜尋”:(1)Search-o1,一個能夠讓推理模型邊思考邊搜尋的框架,並透過外部的文件推理模組深度分析檢索的文件,來保持推理過程的連貫性;(2)WebThinker,在此基礎上繼續增加了網頁探索的深度以實現深度研究的能力,並能夠讓推理模型自主撰寫完整的調研報告。此外,WebThinker還引入了基於RL的模型訓練,來進一步強化模型深度研究的能力。透過這次分享,我們期待與社群共同推動大模型推理領域的研究進展。
4
直播平臺
直播平臺
影片號
B站

會議報名可以直接掃描下方二維碼進入交流群。會議的觀看地址等資訊都會在群裡通知。已經加入MLNLP交流群的同學請不用重複新增!

掃描二維碼進入MLNLP交流群
關於我們
