HKUNLP知名學者重磅來襲!

MLNLP 社群是國內外知名自然語言處理社群,受眾覆蓋國內外NLP碩博生、高校老師以及企業研究人員。
社群的願景是促進國內外自然語言處理,機器學習學術界、產業界和廣大愛好者之間的交流,特別是初學者同學們的進步。
MLNLP 2025學術研討會是由MLNLP社群中國中文資訊學會青年工作委員會聯合舉辦的學術活動。社群會定期舉辦學術研討會並邀請國內外機器學習與自然語言處理領域知名青年學者進行報告交流,旨在加強國內外學者之間的交流。
MLNLP社群將在03月30於線上舉辦第二十九次學術研討會,由香港大學的馮夏衝博士後李磊博士生共同擔任本期程式委員會主本期研討會分為上下兩半場:上半場由馮夏衝主持;下半場由李磊主持。具體而言,社群很榮幸邀請到香港大學助理教授孔令鵬老師擔任大會主席,並做開場致辭;香港大學博士陶熙佳,香港大學博士生謝天寶,華南理工大學本科生魏源成香港大學博士生龔姍三香港大學博士生謝知暉,香港大學博士生李沁桐做專題報告。
1
會議概況
  • 召開時間:
    • 2025年03月30日 9:00-12:10(北京時間)
  • 主辦單位:
    • MLNLP社群
    • 中國中文資訊學會青年工作委員會
  • 大會主席:
    • 孔令鵬香港大學助理教授
  • 程式委員會主席:
    • 馮夏衝香港大學博士後
    • 李磊香港大學博士生
  • 組委會:
    • MLNLP社群秘書處(劉洪宇、段然、陳麒光、鹿純林、李勤政、周璟軒)
  • 直播平臺:
    • 嗶哩嗶哩:http://live.bilibili.com/23872620
    • 微信影片號:請點選下方卡片預
2
日程安排
3
嘉賓介紹
一、大會主席:

孔令鵬
香港大學助理教授
嘉賓簡介:孔令鵬,卡內基梅隆大學博士,香港大學計算機科學系助理教授,香港大學NLP實驗室聯合主管。在加入港大前,他於2017年至2020年在谷歌DeepMind擔任研究科學家。他的研究透過設計利用語言結構的表示學習演算法來解決自然語言處理(NLP)中的核心問題。他的工作處於深度學習和結構化預測的交叉點,應用重點是句法解析、語音識別、社交媒體分析和機器翻譯,在各類高水平國際學術刊物上發表論文逾60篇。個人主頁:https://ikekonglp.github.io/
二、主持人:

馮夏衝
香港大學博士後
嘉賓簡介:馮夏衝,香港大學博士後,哈爾濱工業大學博士。在CCF-A和中科院1區等會議期刊發表多篇論文,曾獲博士生國家獎學金、CCL 2021最佳英文長文獎。個人主頁:https://xcfeng.net/。
李磊
香港大學博士生
嘉賓簡介:李磊,香港大學計算機科學系博士研究生,師從孔令鵬教授和劉琦教授。其研究聚焦於多模態大語言模型與大模型可解釋性分析等領域,迄今已在頂級會議與期刊(包括ICLR、CVPR、ACL、EMNLP及TASLP)發表多篇論文,其中一項研究榮獲EMNLP 2023年度最佳長文獎。個人主頁:https://lilei-nlp.github.io/
三、分享嘉賓:

陶熙佳
香港大學博士生
嘉賓簡介:陶熙佳,香港大學計算機科學系博士研究生,師從孔令鵬教授,研究興趣包括強化學習,多模態大語言模型和可解釋性分析等領域。個人主頁:https://xijia-tao.github.io/
報告題目:一張圖片攻陷視覺大模型多模態的安全性新挑戰
報告簡介:隨著視覺模態被廣泛整合到大語言模型中,新模態引發的安全隱患逐漸顯現。我們提出了一種基於資料投毒的攻擊方法ImgTrojan,透過在訓練過程中植入圖片形式的特洛伊木馬,導致文字與視覺模態的錯誤對齊。相比文字木馬,圖片木馬更具隱蔽性,在推理階段更難被察覺。報告還將探討多模態模型中木馬的生成機制,並結合以往關於大模型可解釋性的研究展開討論。我們希望本次分享能夠加深社群對多模態大語言模型安全性的理解
謝天寶
香港大學博士生
嘉賓簡介:謝天寶,香港大學博士三年級在讀,由余濤(主要)和孔令鵬老師指導。獲香港政府博士獎學金和香港大學校長獎學金資助。他在人工智慧頂級會議如ICLR, NeurIPS, EMNLP等發表多篇論文。他的主要研究興趣在於人工智慧和自然語言處理,特別專注於開發大規模神經符號人工智慧系統和自主智慧體。個人主頁:https://tianbaoxie.com
報告題目:OSWorld:面向真實計算機環境的開放式任務多模態智慧體
報告簡介:OSWorld 是一個可擴充套件的並行環境,用於構建和評估自主數字智慧體在各類真實世界計算機任務中的表現。OSWorld支援包括 Ubuntu、Windows 和 macOS 在內的多個作業系統,能夠在涉及網路和桌面應用程式的互動式環境中對智慧體進行全面的、基於執行的訓練和評估。該基準測試包含 369 個來自實際應用場景的任務。測試結果顯示,即使是最先進的多模態模型智慧體也僅能達到 22% 的成功率,而人類的成功率則達到 72.36%,這凸顯出了當前智慧體的侷限性。該平臺為推進多模態智慧體的開發提供了關鍵性的見解。所有相關資源均已開放,以促進研究者在這一極具前景的領域進行深入探索。
魏源成
華南理工大學本科生
嘉賓簡介:魏源成,華南理工大學軟體學院本科生。主要研究方向為多模態大語言模型。
報告題目:VL-RewardBench:通往多模態self-play的試金石
報告簡介:隨著模型能力的提升,合成數據與 Self-Play 已成為 LLMs 和 VLMs 後訓練的關鍵環節,其中 LLMs-as-a-Judge 作為資料篩選的重要正規化備受關注。隨著 LLM 邁向全模態,VLM-as-a-Judge 也將在多模態領域發揮重要作用,但其評估能力仍面臨挑戰。為此,我們構建了 VL-RewardBench 評估當前 VLMs 在此任務領域上的表現,並探討如何提升其能力。本次分享將圍繞VL-RewardBench進行介紹,並希望能給社群帶來一些insight,一起推動VL-RMs的發展和LVLMs的資料合成及評估。
龔姍三
香港大學博士生
嘉賓簡介:龔珊三,香港大學計算機科學系博士研究生,師從孔令鵬教授,研究方向涵蓋擴散語言模型和長文字語言模型等領域。她在頂級會議如ACL、EMNLP、ICLR等發表多篇論文,相關工作曾獲ACL 2024年度傑出論文獎。個人主頁:https://summmeer.github.io/
報告題目:擴散語言模型的非自迴歸推理
報告簡介:隨著大語言模型的快速發展,傳統自迴歸(AR)模型在推理任務上的優勢已被廣泛驗證。然而,擴散語言模型(Diffusion LM)作為一種非自迴歸生成正規化,展現出了獨特的潛力,尤其在推理任務中具有更強的資訊整合能力。本次報告將介紹擴散語言模型在推理領域的最新進展,包括其在鏈式思維推理(DoT)、複雜規劃任務(如24點、數獨)中的應用,以及在7B引數規模DiffuLLaMA在各類任務下的表現。研究表明,擴散模型由於其雙向資訊處理能力,在特定推理任務上優於AR模型。本次分享將圍繞擴散模型的架構、任務適應性及其未來發展方向展開討論,期待與社群共同推動該領域的研究進展。
謝知暉
香港大學博士生
嘉賓簡介:謝知暉,香港大學計算機科學系博士研究生,師從孔令鵬教授(主要導師)及劉琦教授,研究方向涵蓋大語言模型對齊、強化學習、多模態模型等領域。他在頂級會議如ICLR、NeurIPSICML等發表多篇論文。個人主頁:https://zhxie.site/
報告題目:當獎勵成為漏洞:從對齊本質出發自動“越獄”大語言模型
報告簡介:隨著大語言模型的廣泛應用,其安全性和可靠性問題日益突出,特別是"越獄攻擊"(jailbreaking)現象引起了研究界的廣泛關注。在本次分享中,我們將介紹我們發表於ICLR 2025的研究成果。該研究首次從"獎勵錯誤規約"(Reward Misspecification)的角度解釋了為什麼大語言模型會存在越獄漏洞。我們提出了ReGap度量方法來量化獎勵錯配程度,並基於此構建了ReMiss自動化紅隊系統,能夠高效生成對抗性提示,探索模型的安全漏洞。ReMiss在AdvBench基準測試上顯著優於現有方法,不僅攻擊成功率高,還能保持生成提示的可讀性。更重要的是,我們的方法能自動發現多樣化的攻擊模式(如翻譯、續寫、上下文示例等),並且對包括GPT-4o在內的閉源模型展現出極強的攻擊遷移能力。透過這次分享,我們希望為大語言模型安全對齊研究提供新的理論視角和實用工具,推動構建更安全可靠的人工智慧系統。
李沁桐
香港大學博士生
嘉賓簡介:李沁桐,香港大學計算機科學系博士研究生,師從孔令鵬教授(主要)和Ben Kao教授指導,研究方向涵蓋大語言模型推理,評估和資料合成等領域。她在人工智慧頂級會議如ACL、ICLREMNLP等發表多篇論文。個人主頁:https://qtli.github.io/
報告題目:大語言模型的自適應最佳化:評估驅動的迭代增強
報告簡介:大語言模型在數學推理基準測試中展現出驚人的表現,但其真實推理能力仍存在爭議。本次報告將從三個維度深入探討這一問題:首先,我們透過構建GSM-Plus資料集,系統性地評估了大語言模型在面對數學問題變體時的魯棒性,發現即便是在相似問題上,模型表現也可能出現顯著波動。其次,針對評測成本高昂的問題,我們深入分析了以大語言模型作為評測者的可行性,揭示了其在不同評測標準下的優劣勢,並提出了結合人類專家的混合評測框架。最後,我們提出ReverseGen方法,透過自動發現模型的薄弱環節並據此最佳化,實現了模型能力的迭代提升。這一系列工作為構建更可靠、更強大的大語言模型提供了新的思路和方法論支援。我們期待透過這次分享,與社群一起推動大語言模型領域的研究和持續進步。

4
直播平臺

影片號
B站
5
會議報名
會議報名可以直接掃描下方二維碼進入交流群。會議的觀看地址等資訊都會在群裡通知。已經加入MLNLP交流群的同學請不用重複新增

掃描二維碼進入MLNLP交流群

關於我們

MLNLP 社群是由國內外機器學習與自然語言處理學者聯合構建的民間學術社群,目前已經發展為國內外知名的機器學習與自然語言處理社群,旨在促進機器學習,自然語言處理學術界、產業界和廣大愛好者之間的進步。
社群可以為相關從業者的深造、就業及研究等方面提供開放交流平臺。歡迎大家關注和加入我們。

相關文章