地平線/智源/位元組/凌川科技齊聚上海,共探編譯器最佳化新進展

2024 Meet AI Compiler 第 6 期技術沙龍將於 12 月 28 日在上海五角場創新創業學院舉辦。
2023 年,HyperAI超神經在北京、上海、深圳舉辦了 4 場 Meet TVM 線下聚會,聚集了超 1 千位資深從業者及愛好者,逐步建立了豐富的社群生態。2024 年,HyperAI超神經聚焦 AI 編譯器領域,繼續為業內人士提供開放的交流平臺,在今年 7 月舉辦了 Meet AI Compiler 技術沙龍的第 5 期。如今,2024 年接近尾聲,大模型賽道激戰未停,AI 編譯器有哪些新突破、新應用?
12 月 28 日,HyperAI超神經將在上海五角場舉辦第 6 期 Meet AI Compiler 技術沙龍,本次活動分為技術分享和圓桌討論 2 個環節。
首先,我們有幸邀請到了來自地平線、北京智源人工智慧研究院、字節跳動、凌川科技的 4 位資深專家,為大家分享他們的應用案例與行業觀察。此外,上海交通大學博士、Apache TVM PMC 馮思遠將擔任圓桌環節的主持,從專業的技術角度,和嘉賓們進行思維的碰撞。
我們還為大家準備了精美禮品與茶歇,報名活動並關注「HyperAI超神經」公眾號,後臺回覆「1228上海」即可參與抽獎,獎品需在 12 月 28 日當天活動現場線下領取哦,快來參與吧~
活動詳情
⏰ 時間:12 月 28 日(週六)13:30-17:45
📍 地點:上海五角場創新創業學院 2F 報告廳(楊浦區大學路 322 號)
👬 人數:200(現場座位有限,請儘早報名) 
🙌🏻 報名:點選下方小程式報名
掃碼備註「AI 編譯器」加入活動群:
📝 議程:
嘉賓及議程
環節 1
分享嘉賓
13:40-14:20
李建軍
地平線 
編譯器研發負責人
分享主題:Transformer 模型的編譯 & 部署最佳化實踐
內容簡介:Transformer 模型近年來不僅在 LLM 領域取得了顯著的成果,也在計算機視覺領域得到了廣泛的應用。在自動駕駛場景中,Transformer 模型的編譯和部署最佳化是一個複雜的過程,端到端模型、VLM 都對端側的編譯最佳化和部署提出了非常大的挑戰。本次分享主要介紹地平線在這方面的一些實踐和經驗。
觀看本場分享,你將瞭解:
1. 視覺 Transformer 模型編譯最佳化和部署面臨的挑戰
2. 地平線在 Transformer 模型編譯最佳化上的探索和實踐
14:20-15:00
李之昕
北京智源人工智慧研究院
AI 編譯器研發工程師
分享主題:FlagGems:研發進展與生態應用探索
內容簡介:自 2.0 版本釋出以來,在智源團隊、合作廠商及 Triton 中國社群的緊密協作下,FlagGems 在運算元支援數量、計算效能、程式碼生成以及執行時機制等方面取得了顯著的研發突破。同時,FlagGems 貫通領域上下游,在大模型訓練與推理適配、多後端晶片整合等方面展開了創新探索,進一步拓展了運算元庫在多元生態中的應用場景。
觀看本場分享,你將瞭解:
1. FlagGems 的最新研發成果和技術提升
2. 運算元庫與大模型適配的創新實踐與經驗
3. 多後端晶片整合的技術方案與應用效果
4. Triton 中國社群與多元生態建設進展
15:15-15:55
鄭思澤 
字節跳動 TopSeed
Research Scientist
分享主題:從計算-訪存-通訊最佳化看 AI 編譯器設計
內容簡介:面向 AI 晶片的編譯最佳化需面臨 3 個角度的最佳化挑戰:計算、訪存、通訊。本報告將分享 3 個方面的 AI 編譯器設計與最佳化經驗。計算角度,分享針對定製化加速單元的最佳化;訪存角度,分享針對 AI 晶片的訪存建模和最佳化;通訊角度,分享計算通訊融合的經驗和進展。
觀眾觀看本場分享,你將瞭解:
1. AI 編譯器最佳化的全域性視角
2. 瞭解充分發揮 AI 晶片算力的經驗技巧
3. 瞭解未來分散式 AI 編譯器發展方向
15:55-16:35
湯旭濤
凌川科技
AI Compiler 架構師
分享主題:基於多核架構 NPU 的大模型編譯最佳化與推理加速實踐
內容簡介本次分享聚焦於多核架構 NPU 在大模型編譯最佳化與推理加速中的實踐探索。透過分析 Transformer 等大模型的計算特性,提出基於 tiling 策略的矩陣最佳化、資料並行與模型並行的排程機制,以及融合運算元與流水線化設計的高效推理方法。結合多核架構的並行特性,優化了運算元分解、記憶體管理,大幅提升推理吞吐量與資源利用率。
觀看本場分享,你將瞭解:
1. 雲端大模型推理晶片的架構
2. Transformer 架構下 Attention 超級運算元的最佳化策略
環節 2
圓桌討論
圓桌主題:晶片-網路-軟體-演算法-生態的協同發展
主辦方及合作伙伴
HyperAI超神經是國內領先的人工智慧及高效能計算社群,旨在透過提供資料集加速下載、線上教程演示、論文深度解讀、頂會日曆整合等多種基礎設施,助力中國的資料科學與⼈⼯智慧⾏業的開發者、愛好者學習、理解、實踐,與社群⼀起構建⼈⼯智慧的未來。目前超神經官網已經上線數千個經典及優質公開資料集和教程,並運營國內最活躍的 AI 編譯器社群。
訪問官網:https://hyper.ai/
OpenBayes貝式計算是國內領先的高效能計算服務提供商,透過為新一代異構晶片嫁接經典軟體生態及機器學習模型,進而為工業企業及高校科研提供更加快速、易用的資料科學計算產品,其產品已被數十家大型工業場景或頭部科研院所所採用。
訪問官網:https://openbayes.com/
MLC.AI 社群成立於 2022 年 6 月,並由 Apache TVM 主要發明者、機器學習領域著名的青年學者陳天奇,帶領團隊上線了 MLC 線上課程,

系統介紹了機器學習編譯的關鍵元素以及核心概念。

2022 年 11 月,在 MLC.AI 社群志願者的共同努力下,首個完整的 TVM 中文文件上線,併成功託管至 HyperAI超神經官網,進一步為對機器學習編譯感興趣的國內開發者,提供了接觸並學習一門新技術的基礎設定——文件。
MLC 線上課程:https://mlc.ai/
TVM 中文文件:https://tvm.hyper.ai/
上海五角場創新創業學院是楊浦區政府聯合著名高校及行業龍頭企業、創服機構共同發起設立的非營利性教育及服務組織。以「創造深度連線,讓創新創業更容易成功」為使命,連線創業者和賦能方、提高雙創要素資源的配置效率,促進創造發生。
五角場創院 2022 年 11 月,正式啟用學院公共空間,將 800 平米的空間開放共享給雙創人群,並聯合港中大上海中心、瑞安集團等夥伴共同發起雙創公益品牌「學院咖啡」,並邀請對雙創公益服務有共識的 KOL、企業和社會組織,成為「公益合夥人」,共同設計不同形式的創業者聚集方式,截止目前「學院咖啡」共舉辦 140+ 場不同形式的雙創主題活動,匯聚 3000+ 位參與者。
活動支援
活動行:掃碼跳轉至活動行報名
掃碼備註「AI 編譯器」加入活動群
考慮到本場活動的場地空間情況,我們僅開放了 200 個到場名額,建議大家儘早報名鎖定席位。
12 月 28 日 13:30-17:45,期待與大家在上海相聚!


相關文章