
6 月 27 日 -6 月 28 日,AICon 全球人工智慧開發與應用大會北京站即將拉開帷幕。本次大會將匯聚 AI 前沿技術與落地實踐,邀請來自騰訊、阿里、百度、字節跳動等頭部大廠以及智譜、矽基流動、智象未來、聲智科技等 AI 企業的 50+ 資深專家,深度探討 AI Agent、多模態應用、推理效能最佳化以及 AI 在軟體研發、資料分析、業務運營等場景的具體落地實踐。
IDEA 研究院計算機視覺與機器人研究中心講席科學家張磊已確認出席並將在 Keynote 主論壇發表題為 《從檢測到通用感知:構建空間智慧的基礎》 的主題分享。視覺感知是機器和物理世界互動的基礎,也是 AI 走向通用必須具備的能力。本次分享將以視覺感知中的物體檢測問題為核心,分析語言原生和視覺原生模型架構的特點和區別,並介紹基於 Transformer 的物體檢測演算法的核心思路,包括 DETR 到 DINO 的演化和改進,及面向通用感知的開集檢測技術的進展,如 Grounding DINO 和 DINO-X,探討其在物體關鍵點定位、屬性理解以及 3D 感知方面的擴充套件和延伸,為構建空間智慧提供強大的技術基礎,並透過例項分析和實驗結果,展示這些技術在實際應用中的效果和潛力。

張磊博士現任 IDEA 研究院計算機視覺與機器人研究中心講席科學家、IEEE Fellow,曾任微軟亞洲研究院、微軟總部研究院首席研究員,長期帶領研究組從事計算機視覺基礎研究和大規模影像分析、物體檢測、視覺語言多模態理解的應用研究,其研究成果廣泛用於微軟必應搜尋及認知服務雲計算平臺。他於 2021 年加入 IDEA 研究院並創立計算機視覺與機器人研究中心,在物體檢測方向做出一系列研究工作,其中 DINO 演算法首次奠定了 DETR 類演算法在物體檢測領域的 SOTA 地位,Grounding DINO 及後續的 DINO-X 等工作成為視覺領域效能最好的開集物體檢測模型。他在計算機視覺等相關領域發表論 150 多篇,並擁有 60 多項美國授權專利。他在本次會議的詳細演講內容如下:
-
視覺感知和物體理解的重要性
-
語言原生和視覺原生模型架構的區別
-
從閉集檢測到開集檢測的研究
-
從檢測到通用感知的研究
-
從通用感知到空間智慧的延伸
-
總結與展望
-
瞭解現有的多模態大模型在物體理解方面的侷限和可能的原因 -
瞭解構建空間智慧需要的物體理解能力和相關技術 -
瞭解物體檢測和通用感知方向的前沿研究進展
除此之外,大會 Keynote 還邀請了矽基流動創始人 &CEO 袁進輝、Open Infrastructure Foundation Chief Operating Officer Mark Collier 、阿里雲智慧集團研發副總裁丁宇(叔同),他們將在主題演講中分享 Agent、AI 程式設計等領域的趨勢洞察與正規化革新。
本次大會還策劃了 AI Agent 構建與多場景實踐、多模態實踐與應用、大模型助力研發的實戰經驗、AI 在業務運營中的深度落地、大模型時代的資料處理與分析、AI 變革下的工程師等 10 多個專題論壇,屆時將有來自不同行業、不同領域、不同企業的 50+ 資深專家在 AICon 北京站現場帶來前沿技術洞察和一線實踐經驗。
現在報名即可以享受 9 折優惠,單張門票立省 580 元,詳情可掃碼或聯絡票務經理 13269078023 諮詢。
