2025中國生成式AI大會四月舉行!聚焦推理模型、AIInfra、AI智慧體與具身大模型

2025年4月1-2日,2025中國生成式AI大會(北京站)將在北京中關村東昇科技園萬麗酒店舉行。中國生成式AI大會已成功舉辦三屆,現已成為國內人工智慧領域最具影響力的產業峰會之一。
本次大會繼續由智一科技旗下智猩猩、智東西共同發起,以“大拐點 新徵程”為主題,計劃邀請50+位重量級嘉賓同臺分享和討論,深入透視DeepSeek帶來的顛覆與重構,全面展示國內生成式AI重大進展。
中國生成式AI的發展,尤其是大語言模型,已經從GPT引領切換到DeepSeek驅動。AI Infra在國內的研究與開發方向更加明確,國產AI晶片與算力領域也獲得再次突圍的新動能。此外,包括AI智慧體、AIGC應用在內的應用熱潮更是備受期待。與此同時,視覺大模型、多模態大模型、具身大模型在過去一年也取得了非常大的進展,呈現出百花齊放的局面。
本次大會圍繞上述重大變化進行了日程設計。大會主會場首日將進行開幕式、GenAI應用論壇,次日全天將進行大模型峰會;分會場則會先後組織DeepSeek R1與推理模型技術研討會、AI智慧體技術研討會和具身智慧大模型技術研討會。其中,三場研討會為閉門制,主要面向持有閉門專享票、貴賓通票的觀眾開放。
已經迫不及待報名的朋友,可以先掃描下方二維碼新增小助手報名啦!
目前,來自35+家企業、高校與科研機構的嘉賓學者已確認參與主題演講和圓桌Panel。
其中,智源研究院副院長兼總工程師林詠華將參與開幕式。還有多位嘉賓是來自清華大學、北京大學、中國人民大學、西湖大學的知名學者和青年學者。
AI智慧體方向,也邀請到不少嘉賓,其中就包括通用智慧體Manus最強平替「OWL」的一作胡夢康博士,AppAgentX一作蔣文嘉,Eko主要作者陸逸文博士;AI Infra方面也是來了不少大咖,其中就包括上海交通大學副教授、無問芯穹聯合創始人兼首席科學家 戴國浩;推理模型方向,由中國人民大學高瓴人工智慧學院教授領銜,Light-R1核心作者、360智腦演算法資深專家鄒昊晟,華中科技大學Hust Vision Lab與地平線聯合培養博士生、AlphaDrive一作蔣博。
具身智慧方向更是牛人云集,包括星海圖聯合創始人許華哲教授、智澄AI創始人&CEO&前Meta首席工程負責人胡魯輝、RoboMamba一作劉家銘、雙臂機器人操作擴散大模型RDT一作劉松銘、星動紀元實習研究員郭彥江博士、北京智源人工智慧研究院研究員郝孝帥,上海人工智慧實驗室具身智慧中心青年研究員汪汗青以及“杭州六小龍”之一群核數據的科研演算法專家汪仁涵。
接下來一一介紹。更多資訊可以從文末「閱讀原文」進入大會官網瞭解。
開幕式(部分嘉賓)
智源研究院副院長兼總工程師 林詠華
中國人民大學高瓴人工智慧學院教授 趙鑫
演講主題:《大模型慢思考技術探討》
內容概要:
最近以DeepSeek-R1為代表的大模型慢思考技術受到了較大關注,慢思考模型透過生成更長的思考過程來解決更具挑戰性的問題,在多個科學場景和應用領域都取得了重要突破。
本次報告將聚焦大模型慢思考的基礎技術與實現方法,對於其中可能涉及到的技術路徑進行探索和系統性講解,主要介紹以強化學習為主線的關鍵技術,並結合自身實踐經驗討論其中的技術挑戰,然後探討推理模型的科學價值,並且總結現階段推理模型的侷限以及未來的技術發展趨勢。
清華大學交叉學院助理教授、博導、星海圖聯合創始人 許華哲
演講主題:《破解具身智慧中的資料難題》
內容概要:
具身智慧的資料難題核心在於多模態感知-動作耦合資料的稀缺性與異構性:真實物理互動資料獲取成本極高(如機器人操作需百萬級閉環互動),且跨場景遷移受限;多源感測器(觸覺、視覺、力覺)的資料難以獲得,時空對齊與語義關聯複雜度呈指數級增長,而模擬到真實(Sim2Real)的資料偏差進一步加劇模型退化。當前突破方向集中在物理啟發的資料增強與因果表徵學習,透過解耦環境動態性與本體控制邏輯提升資料效用。
GMI Cloud創始人、CEO Alex Yeh
GenAI應用論壇(部分嘉賓)
愛詩科技商業化負責人 孫偉哲
GMI Cloud亞太區總裁 King.Cui
演講主題:《AI推理的全球算力革命:從單點爆發到全球擴容》
內容概要:
AI應用全球化浪潮下, 推理效率與算力供給成為破局關鍵。本次演講以GMI Cloud Inference Engine為錨點,拆解其高併發、低延遲、動態擴縮容能力如何支撐全球AI業務爆發,深度分享GMI Cloud自研推理平臺的架構設計、跨區域合規部署及軟硬協同最佳化實踐,揭秘其實現推理成本、指數級效率提升的關鍵路徑。
Zilliz合夥人、產品總監 郭人通
演講主題:《從Infra的角度看DeepSearch Test-Time Scaling Law》
內容概要:
近期 Agent 與垂域的結合越來越受到產業關注,Zilliz 也對 OpenAI DeepSearch 進行了簡單復刻嘗試。在這次嘗試以及在使用者的交流中,我們認識到 Agent 的 Scaling Law 本質是資料資訊探索效率,報告中我們會分享 zilliz 的觀察,並介紹我們在資料基礎設施層面解決資料資訊探索效率的最新嘗試。
楓清科技Fabarta創始人兼CEO 高雪峰
演講主題:《知識引擎與大模型雙輪驅動:打造下一代企業級智慧體應用平臺》
內容概要:
在企業智慧化浪潮中,僅僅依賴通用大模型往往難以滿足複雜業務場景對精準性和可解釋性的嚴苛要求。知識引擎的引入,如同為大模型裝上了精準的導航系統和強大的邏輯推理能力,顯著提升智慧體在理解企業Know-how、執行任務和決策方面的能力,更可靠地執行任務。同時,知識引擎更是提煉行業大模型、構建行業智慧應用的基礎。這種“雙輪驅動”的模式,將成為企業構建下一代核心競爭力的關鍵引擎,最終驅動企業實現真正意義上的智慧進化。
博查AI搜尋聯合創始人&CTO 翁柔瑩
光羽芯辰創始人兼董事長 周強    
大模型峰會(部分嘉賓)
上海交通大學副教授、無問芯穹聯合創始人兼首席科學家 戴國浩
澳鵬Appen中國及韓國區副總裁 董成
焱融科技CTO 張文濤
演講主題:《破局AI算力瓶頸:高效能全快閃記憶體儲在訓練與推理中的場景化實踐》
內容概要:
DeepSeek的開源堪比ChatGPT時刻,引發了AI技術的新一波浪潮,從開源推理模型到開源底層基礎設施,公佈了端到端的大模型訓練和推理技術路線。在開源的基礎架構中,高效能全閃分散式檔案是訓練和推理的資料底座,支撐了AI訓練的高吞吐,同時也提供了基於檔案儲存的上下文KVCache快取解決方案,以存代算,大幅降低了推理成本,
本次演講將介紹焱融科技的高效能全快閃記憶體儲產品在訓練和推理中的應用場景和實踐。
智澄AI創始人&CEO 胡魯輝
演講主題:《物理智慧:開啟人形機器人新時代》
內容概要:
人工智慧正以前所未有的速度塑造世界,生成式AI如GPT系列帶來了認知層面的突破。然而,真正推動下一波人工智慧革命的關鍵是物理智慧(Physical Intelligence)。物理智慧旨在賦予AI具備真實世界的感知、理解與操控能力,使機器不僅能“理解”物理世界,更能主動“干預”物理世界。
本演講將深入探討:
1)為什麼物理智慧是繼生成式AI之後,推動機器人時代到來的重要力量?
2)人形機器人如何透過物理智慧實現“感知—認知—行動”的閉環,真正融入現實場景?
3)當前AI技術(如多模態大模型、強化學習與模仿學習、VR遙操作和通用機器人互動介面)如何助力物理智慧的發展?
4)未來物理智慧如何推動機器人從工具走向伴侶甚至夥伴,引領下一個產業與社會變革的浪潮?
5)智澄AI引領理解物理世界大模型,介紹在物理智慧方面的突破,並隆重推出智澄AI新一代人形機器人TR4。
透過對前沿技術的解析與實際案例的展示,我們將共同展望一個由物理智慧開啟的機器人新時代。
中昊芯英軟體研發負責人 朱國樑
清程極智聯合創始人、產品副總裁 師天麾    
澎峰科技創始人&CEO 張先軼
首都線上CTO 許濤
Alluxio解決方案架構師 湯文軍
演講主題:《構建大模型時代的AI儲存新正規化》
內容概要:
2024年,端到端自動駕駛是智駕行業的主戰場,這一年國內智駕技術迅猛發展,部分公司已經完成了從智駕1.0向量產級端到端自動駕駛的快速切換,這其中資料基建工程帶來的規模化效應(scaling law)為這一階段性進展提供了強力支撐。
本次將從科研角度分享,監督學習正規化下端到端自動駕駛的新進展及其面臨的關鍵挑戰,分享端到端自動駕駛scaling law的探索,並討論針對目前面臨的關鍵挑戰一些值得進一步探索的研究方向。
Zenlayer行業拓展總監 陳秀忠

DeepSeek R1與推理模型技術研討會(部分嘉賓)
360智腦演算法資深專家 鄒昊晟
報告主題:《Light-R1:低成本復現推理模型之路》
內容概要:
360智腦在3月4日開源了Light-R1模型及全部訓練資料和程式碼,用較低的訓練成本即可從零訓練得到推理模型,在開源時首次實現領域內評測超越DeepSeek-R1-Distill。報告將介紹Light-R1背後的課程學習SFT、RFT、DPO等方法上的資料心得和訓練策略,和QwQ-32B、TinyR1等相關工作在訓練資源、方法等各方面的比較。雖然Light-R1僅使用數學資料訓練了模型的長推理能力,但在非數學任務上也表現出了泛化性及有效性。隨著訓練和推理技術的不斷發展,未來長推理模型將更加普及,Light-R1 正為低成本快速訓練一個領域專精推理模型提供了重要參考。
北大在讀博士、普林斯頓高階研究助理楊靈
報告主題:《基於思維模版LLM層次化推理新正規化》
內容概要:
儘管大型語言模型(LLMs)在複雜推理任務中仍面臨挑戰,但本次分享提出了一種新的推理軌跡表徵方法——思維模板(Thought Template)。首先,Buffer of Thought 框架首次引入“思維模板”概念,用於總結關鍵推理模式。基於此,SuperCorrect 利用思維模板實現了分層的 LLM 蒸餾和自糾錯方法,使小型 LLM 也能達到具有競爭力的表現。隨後,ReasonFlux 透過自動化擴充套件思維模板,並結合分層強化學習演算法最佳化推理搜尋空間的效率,進一步增強了 LLM 的複雜推理能力,以32B的引數規模超越o1-preview並逼近DeepSeek-R1的推理準確率。這些進展表明,思維模板有潛力成為更高效的大模型推理軌跡表徵。
華中科技大學Hust Vision Lab與地平線聯合培養博士生 蔣博
報告主題:《探索DeepSeek強化學習和推理策略在自動駕駛中的巨大潛力》
內容概要:
DeepSeek R1驗證了強化學習在模型自主探索和提升模型能力/訓練效率上的顯著優勢,結合Reasoning策略,有效增強了模型的複雜問題解決能力。在自動駕駛領域,終極任務是planning,這也是一項涉及場景理解、分析、和決策的複雜任務,我們首次嘗試將DeepSeek R1的強化學習和推理策略遷移應用於駕駛領域,並做出一系列針對駕駛規劃的策略最佳化,顯著提升大模型自動駕駛決策規劃的效果,並展現出湧現的多模態規劃能力。歡迎大家多多交流討論。
浙江大學軟體學院碩士研究生二年級 張錦添
報告主題:《長思維鏈高效推理方法——動態壓縮思維過程》
內容概要:
大型語言模型(LLM)在複雜推理任務中生成冗長的中間思維步驟會導致顯著的記憶體與計算開銷,限制了其實際應用效率。現有高效長思維推理方法可以分為兩類,第一類透過提示工程或者訓練的方式讓LLM學會使用較少的詞進行推理,第二類透過在LLM推理過程中對kv快取進行裁剪進行。
本次演講提出LightThinker,一種基於動態思維壓縮的推理加速方法,其核心是透過訓練的方式讓LLM在合適的時機自主壓縮冗長的思維為緊湊的表徵,並基於壓縮後的內容繼續推理,從而降低視訊記憶體開銷,提升推理速度。
AI 智慧體技術研討會(部分嘉賓)
香港大學在讀博士、CAMEL-AI OWL一作 胡夢康
報告主題:《面向真實場景下任務自動化的多智慧體協作系統》
內容概要:
隨著大模型的實際應用蓬勃發展,多智慧體協作系統在真實場景下的任務自動化已成為人工智慧領域的重要研究前沿。本報告系統介紹面向真實場景任務自動化的多智慧體協作系統研究,包括框架設計、效能最佳化、系統擴充套件等關鍵技術,探索為複雜任務自動化提供高效解決方案的方法與路徑。
本次報告,將重點介紹OWL (Optimized Workforce Learning)框架,該框架在GAIA基準測試中取得58.18的平均得分,位列開源框架第一,並在GitHub上已獲得11,000+星標的矚目關注。此外,報告探討解決智慧體系統在真實應用場景中面臨的關鍵挑戰的創新工作:(1) 高效閉環規劃(Tree-Planner),最佳化智慧體決策路徑;(2) LLM智慧體環境擴充套件性解決方案(AgentGen與Text2World),實現大規模場景適配;(3) 層次化管理LLM智慧體上下文技術(HiAgent),提升系統執行效率與穩定性。
西湖大學 AGI 實驗室 Agent 方向研究員 蔣文嘉
報告主題:《驅動GUI智慧體從智慧化到高效化的實踐探索》
內容概要:
現有LLM驅動的GUI智慧體面臨決策鏈冗長、重複推理成本高等瓶頸,傳統指令碼化工具難以適應動態介面,而大模型雖提升泛化能力卻犧牲了執行效率。針對GUI操作缺乏"肌肉記憶"和跨應用泛化難題,我們提出分層記憶庫與視覺-語義解耦架構的雙重最佳化方案:透過規則構建動態進化機制,將常用操作路徑推理耗時縮短60%以上。工程實踐中採用混合推理框架(規則引擎兜底+LLM決策),在複雜場景測試顯示,任務完成率從傳統方案的47%提升至89%,資源消耗下降40%。
清華大學計算機系博士生、Agent Hospital一作 李俊凱
報告主題:《基於大模型的可進化醫療智慧體—Agent Hospital》
內容概要:
Agent Hospital這一專案透過構建虛擬醫院環境,賦能AI醫生在動態複雜場景中持續進化,目標實現醫療能力的突破性提升。本次報告,我將從以下五個方面進行展開:
首先,我將介紹大模型與智慧體融合的醫療新正規化。大模型是“魂”,為醫療智慧體提供底層認知能力;智慧體是“體”,從靜態資料處理轉向動態環境互動,單智慧體拓展能力邊界,多智慧體協同解鎖複雜醫療流程。其次,可進化性是AI醫生的核心突破。AI醫生依託虛擬醫院生成無限病例,實現無標註資料自進化,診療能力超越人類速度。接著,將重點解讀我們提出的基於大模型的可進化醫療智慧體Agent Hospital。之後將展望未來醫療從實體醫院到人工智慧醫院的三大趨勢。最後,將介紹我們的專案影響力以及對行業的啟示。
清華大學自動化系博士研究生、Eko主要作者 陸逸文
報告主題:《基於工作流的可干預 Agent 框架Eko》
內容概要:
本次報告將探討一種新興的智慧體設計正規化——基於工作流(workflow)的可干預智慧體框架 Eko。與傳統端到端自治代理的黑箱模式不同,Eko 強調以結構化任務圖清晰地規劃和執行復雜任務,具備更好的透明性與審計性;同時,提供生產級的干預機制,允許使用者在任務執行的任意環節精細介入,以確保智慧體的行為始終可控且可審計。此外,Eko 還支援跨瀏覽器、桌面等多種執行環境的無縫部署,能夠靈活整合企業私域資料,從而在生產實踐中顯著提高智慧體的落地可靠性與安全性。基於上述特點,Eko 已經初步展現出在具身智慧等領域進行任務編排的潛力,值得進一步探索
ANP開源技術社群發起人常高偉
報告主題:《從MCP到智慧體通訊協議:ANP在智慧體網際網路上的探索》
內容概要:
MCP自推出以來,逐漸的獲得行業的廣泛關注。MCP在解決模型與工具/資源連線方法的標準化上,發揮了重大的作用,能夠有效降低模型獲得上下文、呼叫工具的成本。
然而,智慧體網際網路要求所有的智慧體都能夠互聯互通。MCP並不是為了智慧體而設計,其中心化的身份認證方案和CS的協議架構,使其並不適合用於智慧體的連線、通訊與協作。
當前行業已經出現多個專為智慧體而設計的通訊協議,其中ANP(AgentNetworkProtocol)的設計更為前瞻、實現更為完備。ANP解決了智慧體身份、智慧體描述、智慧體發現三大難題,基於ANP能夠構建便於AI訪問的資料網路。這為即將到來的智慧體網際網路探索了一條新的技術路線。
具身智慧大模型技術研討會(部分嘉賓)
北京智源人工智慧研究院研究員 郝孝帥
報告主題:《統一具身多模態大腦模型RoboBrain》
內容概要:
本次報告我將從以下兩方面進行解讀:
(1)我們提出了ShareRobot,一個大規模、高質量、細粒度的異構資料集,涵蓋102個場景、12種機器人本體和107種原子任務,包含百萬級問答對。資料集標註了任務規劃、物件可操作區域和末端執行器軌跡等多維資訊,填補了現有資料在多樣性、粒度和任務複雜性上的不足,為機器人學習與規劃提供了全面支援。
(2)基於ShareRobot,我們提出了RoboBrain,一個統一具身多模態大腦模型,首次實現任務規劃-可操作區域感知-軌跡預測的三維能力融合。RoboBrain將抽象指令(如“準備一杯茶”)對映為具象動作序列(如抓取、對準、傾倒),並同步生成可操作區域與精確軌跡,顯著提升機器人在具身長程操作任務中的能力。該模型透過多模態協同,解決了傳統方法在任務分解、感知與動作生成中的割裂問題,為複雜機器人操作提供了全新解決方案。
北京大學在讀博士、 Robomamba一作 劉家銘
報告主題:《構建魯棒且高效的視覺-語言-動作大模型RoboMamba》
內容概要:
本報告旨在探討如何構建更 魯棒且高效 的 視覺-語言-動作(VLA)大模型,並從以下四個方面展開深入討論:1)VLA 模型的輸入方式,2)VLA架構設計,3)VLA訓練策略,4)VLA輸出機制。同時,我們還將分析當前行業內 VLA 發展的最新趨勢,並介紹自研的 高效 VLA 模型—RoboMamba。具體來說,RoboMamba是一個高效的端到端VLA具身大模型,專為機器人場景最佳化設計,旨在實現高效的推理與操作能力。這一成果以題為《RoboMamba:具備機器人推理與操控能力的高效視覺-語言-動作大模型》的論文,發表在全球頂級學術會議NeurIPS 2024上。
清華大學ISRLab在讀博士生、星動紀元實習研究員 郭彥江
報告主題:《基於世界模型的通用機器人策略學習》
內容概要:
構建通用的操作模型是通用機器人最有挑戰性的一個部分,機器人需要具備豐富的物理先驗知識,才能泛化到新任務。影片生成大模型在網際網路影片資料上進行了大規模預訓練,能夠預測合理的未來發展軌跡,壓縮了豐富的物理先驗知識。本次演講主題是如何基於影片世界模型構建通用的機器人操作策略,具體包括Prediction with Action(PAD),Video Prediction Policy(VPP)等兩項工作。
清華大學TSAIL團隊博士生 劉松銘
報告主題:《雙臂機器人操作擴散大模型RDT》
內容概要:
我們提出了一種用於雙臂機器人操作的擴散基座模型——Robotics Diffusion Transformer(RDT),該模型以擴散模型作為基礎,能夠有效地表示多峰的人類動作分佈,並採用可擴充套件的Transformer架構來處理異構的多模態輸入,捕捉機器人資料中的非線性和高頻特性。為了解決資料稀缺問題,文章進一步引入了一種物理可解釋的統一動作空間,該空間可以統一各種機器人的動作表示,並保留原始動作的物理含義,方便學習可遷移的物理知識。透過這些設計,我們成功地在目前(截止文章公佈時,下同)最大的多機器人資料集上對RDT進行了預訓練,並將其擴充套件到12億個引數,這是目前用於機器人操作的最大的基於擴散建模的基礎模型。最後,我們在一個自己收集的多工雙臂資料集上對RDT進行了微調,以提高其雙臂操作能力。在真實機器人實驗中,RDT明顯優於現有方法。它能夠零樣本泛化到未見過的物體和場景,理解和遵循語言指令,僅需1~5個演示就能學習新的技能,並有效地處理複雜的靈巧任務。該專案的程式碼、模型和資料均已開源,請訪問專案主頁:https://rdt-robotics.github.io/rdt-robotics/。
上海人工智慧實驗室具身智慧中心青年研究員 汪汗青
報告主題:《桃源2.0推動通用具身智慧邁向虛實貫通之路》
內容概要:
在實現通用具身智慧所面臨的關鍵挑戰中,首當其衝的是可用資料的稀缺問題:底層海量網際網路資料存在質量低、標註缺失等問題;頂層的同構真機資料成本極高,且存在多樣性問題。模擬資料雖具理論無限性,卻受限於數字資產、專家演示和虛實鴻溝難題。針對上述問題,我們提出"虛實貫通"技術框架以系統化解決現存問題,透過"桃源(GRUtopia)2.0"平臺作為關鍵紐帶,構建了"真實-模擬-真實"閉環技術路徑。桃源2.0具有以下特性:
– 模組化模擬框架:支援導航、操作、運動控制等全任務型別,透過"三行程式碼"快速定義具身任務,實現多工開發平臺統一;
– 智慧場景生成:整合十萬級場景庫與百萬級物體庫,結合自動化生成與隨機化工具,實現複雜場景一鍵構建與資料無限擴增;
– 高效資料工場:提供操作/全身控制遙操作工具與導航批次化採集系統,單機單日可獲取15,000條高質量導航軌跡,大幅降低多元資料採集門檻。
我們透過一系列實驗驗證了“虛實貫通”技術框架在突破模擬內容生產瓶頸的同時能夠有效彌合虛實鴻溝。相信透過相關模型、工具鏈的研發和開源開放,我們能夠和具身智慧領域的研究人員共同探索一條新的通往通用具身智慧的降本增效路徑。
群核科技科研演算法專家 汪仁涵
報告主題:《打破資料之困,讓具身智慧走進物理世界》
內容概要:
資料生成能力是具身AI的“創新引擎”!如何賦予AI跨模態認知與未知環境自適應能力,為智慧體提供無限迭代的感知-決策-行動閉環訓練,驅動具身智慧從“有限訓練”邁向“無限進化”。
大會日程
報名方式
大會設定了四類電子門票,分別是主會場觀眾票、主會場VIP票、閉門專享票和貴賓通票。其中,主會場的座位分佈如下。
四類電子門票中,主會場觀眾票為免費票,申請後需經稽核透過方可參會;主會場VIP票、閉門專享票和貴賓通票均需購買。各類門票的詳細權益可透過文末左下角「閱讀原文」,直達官網進行了解。
想要現場參會的朋友可以掃描下方二維碼新增小助手“泡泡”,進行門票的購買或免費申請。已新增過“泡泡”的老朋友,可以給“泡泡”私信,傳送“GenAI25”即可報名。
✦ 精選內容 ✦

相關文章