都說RAG“爛大街”了，但為何深度應用寥寥無幾？|直播預告

大語言模型技術迅猛發展的腳步，正引領著資訊檢索技術進入一個新的紀元。在這一領域中，RAG 技術將傳統資訊檢索技術與大語言模型技術相結合，為知識理解、知識獲取提供了全新的解決方案。然而，儘管 RAG 在很多工上表現出色，其在深度應用上仍面臨諸多挑戰。

比如：

檢索的準確性和低幻覺，如何適配不同的場景和行業，極大幅度提高準確性以及降低幻覺率。
解答覆雜問題，如何智慧化從各種異構資料來源中獲取資訊，來有效解答覆雜問題。
技術整合的複雜度，需要同時精通檢索系統和大語言模型技術，實際應用中有順暢的體驗（這是效能問題），而且用得起（這是成本問題）等等。

鑑於此，我們策劃了這場以 RAG 技術為主題的圓桌討論活動，旨在探討 RAG 技術的當前進展、面臨的挑戰、未來的發展方向以及在不同行業中的應用潛力。

直播介紹

直播時間

7 月 10 日 20:00-21:30

直播主題

都說 RAG “爛大街”了，但為何深度應用寥寥無幾？

嘉賓

主持人：郭瑞傑阿里巴巴總監 & TGO 鯤鵬會學員
嘉賓：

1.歐明棟阿里雲 /高階演算法專家

2.張穎峰英飛流 /CEO

3.常揚合合資訊 /智慧創新事業部研發總監

直播亮點

RAG 技術在不同行業中的應用差異、挑戰及潛在影響
RAG 技術真的“爛大街”了？對 RAG 技術的深入理解
基於 Agent 的高階 RAG，針對複雜問題的解法
RAG 技術未來的發展預測與暢想

如何看直播？

掃描下圖海報【二維碼】，或戳直播預約按鈕，預約 InfoQ 影片號直播。👇

更多精彩內容，歡迎持續關注 8 月 18-19 日的 AICon 上海站，屆時，幾位老師將帶來如下分享：

講師：歐明棟阿里雲高階演算法專家

演講主題：阿里雲 AI 搜尋 RAG 大模型最佳化實踐

RAG（檢索增強生成）是大模型應用的重要方向，它大幅緩解了大模型幻覺、資訊更新不及時、專業域或私有域知識匱乏等問題，顯著提升了大模型在知識庫問答、網頁搜尋、客服等領域的可信賴度。但我們發現，在實際落地中，RAG 仍存在不少問題，如：文件解析結構丟失、大模型生成幻覺、複雜問題無法解答等等，本次演講我將主要分享以上問題的解決方案，希望能給大家帶來一些啟發和思考。

演講提綱

RAG 技術背景及應用場景介紹；
文件結構化：基於大模型的文件層次結構提取；
RAG 場景生成幻覺最佳化：面向 RAG 的大模型微調；
RAG Agent 探索：基於 Agent 的自適應 RAG；
RAG 案例解析；
總結與展望

聽眾收益

阿里雲 AI 搜尋 RAG 在實際應用場景中碰到的問題及嘗試的解決方案
阿里雲 AI 搜尋 RAG 大模型最佳化實踐中的失敗和成功經驗

講師：王元 IET / 皇家特許工程師

演講主題：從 RAG 到微調：企業知識問答大模型演進之路

越來越多的企業利用大模型構建專屬領域的知識問答型機器人。透過使用 RAG 和提示工程技術，企業可以快速基於預訓練大模型構建功能和產品，但隨著業務量和場景的增加，其效能受到多種因素制約，比如大模型呼叫成本、多場景支援、法務合規等。本次演講將介紹我們透過大模型微調，完成 GPT-3.5 / 開源模型完全替換 GPT-4 的實踐和經驗，並展望未來發展方向。

演講提綱

系統架構的演進
RAG 系統的問題
子模組的指標設計
資料問題及解決方案
微調技術實踐
微調後調優與測試
總結與展望

聽眾收益

瞭解 RAG 和微調的異同與適用場景
瞭解大模型微調的技術難點和實踐經驗
瞭解微調的副作用以及微調後調優策略

講師：常揚合合資訊 / 智慧創新事業部研發總監

演講主題：向量化與文件解析技術加速大模型 RAG 應用落地

大模型落地應用中，RAG（Retrieval-Augmented Generation）與大模型文件相關 Agent 在落地時常遇到文件無法正確解析、表格公式目錄等文件元素解析丟失、知識庫文件解析速度慢、機械分 chunk 丟失語義資訊、目標內容召回不到等問題，極大影響了 RAG 落地應用效果與使用者體驗。

本次演講從 RAG 應用落地時常見問題與需求（文件解析、檢索精度）出發，介紹針對性的高精度、高泛化性、多版面多元素識別支援的文件解析技術方案與整合長文件解析引擎、層級切片技術的向量化 Embedding 模型技術方案，最後分享開放域多模態資訊抽取應用與知識庫問答應用等實際場景的產品實踐案例。

演講提綱

RAG 落地時的常見的問題與需求
文件解析技術 + 向量化技術的研究內容
文件解析技術方案介紹
向量化 Embedding 模型技術介紹
實際場景產品實踐案例

聽眾收益

深入瞭解 RAG 應用落地的挑戰與解決方案
掌握文件解析與向量化 Embedding 模型技術邏輯與原理
透過 RAG 應用落地的案例分享，獲得實踐經驗

講師：張穎峰英飛流 /CEO

演講主題：從 RAG 1.0 走向 RAG 2.0 ——技術挑戰與實現

RAG 1.0 是以 LLMOps 為核心的 RAG 編排系統，透過把各種元件如 Embedding 模型，向量資料庫等編排在一起，快速讓使用者搭建起原型。然而在面向企業級場景使用的時候，常常會面臨各種問題卻無法應對。RAG 2.0 是以搜尋為核心的端到端系統，它將整個 RAG 按照搜尋的典型流程劃分為若干階段：包含資料的資訊抽取、文件預處理、構建索引、以及檢索，並且每個環節都圍繞一系列模型協同工作。本次分享主要帶來 InfiniFlow 在這些環節的具體進展，並介紹如何打造標準化的企業級 RAG 2.0 產品。

演講提綱

RAG 1.0 的痛點
以搜尋為中心的 RAG 2.0

資料抽取模型——實現與演進
文件預處理模型

知識圖譜
聚類
Embedding 的選擇與微調

召回和排序

全文搜尋
Blended RAG 三路召回
Tensor 召回與 Cross Encoder

Agent 與 Agentic RAG

RAG 的未來發展

聽眾收益

如何解決 RAG 落地場景的技術挑戰
如何實現企業級 RAG 和 Agent

內容推薦

AIGC技術正以驚人的速度重塑著創新的邊界，InfoQ 首期《大模型領航者AIGC實踐案例集錦》電子書，深度對話30位國內頂尖大模型專家，洞悉大模型技術前沿與未來趨勢，精選10餘個行業一線實踐案例，全面展示大模型在多個垂直行業的應用成果，同時，揭秘全球熱門大模型效果，為創業者、開發者提供決策支援和選型參考。關注「AI前線」，回覆「領航者」免費獲取電子書。

活動推薦

AICon 全球人工智慧開發與應用大會，為資深工程師、產品經理、資料分析師等專業人群搭建深度交流平臺。聚焦大模型訓練與推理、AI Agent、RAG 技術、多模態等前沿議題，匯聚 AI 和大模型超全落地場景與最佳實踐，期望幫助與會者在大模型時代把握先機，實現技術與業務的雙重飛躍。

在主題演講環節，我們已經邀請到了「蔚來創始人李斌」，分享基於蔚來汽車 10 年來創新創業過程中的思考和實踐，聚焦 SmartEV 和 AI 結合的關鍵問題和解決之道。大會火熱報名中，7 月 31 日前可以享受 9 折優惠，單張門票節省 480 元（原價 4800 元），詳情可聯絡票務經理 13269078023 諮詢。