
商湯技術產品總監劉葉楓已確認出席並發表題為《大規模異構算力叢集的最佳化與排程實踐》 的主題分享,分享商湯基於“大裝置 SenseCore”在國產算力最佳化與排程方面的思考與實踐。闡述如何構建從基礎設施、平臺、演算法到服務的全棧一體化 AI Infra 解決方案。核心實踐聚焦於解決異構算力“用起來、用得好”的難題。此外,還將重點介紹如何分層集合通訊、非同步訓練和自動負載均衡等技術,有效克服混合叢集的“木桶效應”,實現了 NV 與國產算力的協同高效執行,實現例如“異構混訓”、“大規模 EP 推理”等高效訓練推理方案。
劉葉楓現任商湯技術產品總監,在任職期間負責商湯自研深度學習框架及模型生產工具的產品開發與研發管理,主導商湯大模型一體機及大模型專家服務解決方案,將前沿技術轉化為市場化產品,在金融、能源等關鍵行業取得了顯著的應用實踐成果。作為國產化業務負責人,深度參與並推動了軟硬體適配體系的國產化程序,推進落地了多個國家級重大科研專案,為行業的標準化與協同發展貢獻了重要力量。取得 5 項發明專利及 2 項軟體著作權。他在本次會議的詳細演講內容如下:
-
背景與挑戰:介紹 AI 大模型時代,算力需求猛增,以及管理“國產 + 海外”混合算力的核心痛點
-
如何構建從基礎設施、平臺、演算法到服務的全棧一體化 AI Infra 解決方案
-
如何透過大規模的異構叢集排程、通訊庫最佳化技術、訓練推理最佳化讓不同晶片高效協同
-
成果與展望
-
瞭解當前國產異構算力的現狀,並獲得務實可行的國產算力適配與最佳化策略,業務遷移至國產算力的可能性和商業可行性
-
學習提升混合硬體叢集效率的關鍵技術與架構思路
-
洞察 AI 算力基礎設施的未來發展方向與國產化趨勢
除此之外,本次大會還策劃了 AI Infra、AI 產品研發與商業落地探索、Agent 應用新正規化與 MCP 生態實踐、AI 驅動業務重塑與提效、智慧硬體與具身智慧創新實踐、AI 原生時代的卓越架構治理、、多模態與空間智慧技術創新、Agent + Data 落地探索、AI 賦能研發體系變革、Agent 核心技術與系統架構創新、大模型在金融領域的創新實踐等 10 多個專題論壇,屆時將有來自不同行業、不同領域、不同企業的 70+ 資深專家在 AICon 深圳站現場帶來前沿技術洞察和一線實踐經驗。
現在報名即可以享受 9 折優惠,單張門票立省 580 元,詳情可掃碼或聯絡票務經理 13269078023 諮詢。
