
大語言模型技術迅猛發展的腳步,正引領著資訊檢索技術進入一個新的紀元。在這一領域中,RAG 技術將傳統資訊檢索技術與大語言模型技術相結合,為知識理解、知識獲取提供了全新的解決方案。然而,儘管 RAG 在很多工上表現出色,其在深度應用上仍面臨諸多挑戰。
比如:
-
檢索的準確性和低幻覺,如何適配不同的場景和行業,極大幅度提高準確性以及降低幻覺率。
-
解答覆雜問題,如何智慧化從各種異構資料來源中獲取資訊,來有效解答覆雜問題。
-
技術整合的複雜度,需要同時精通檢索系統和大語言模型技術,實際應用中有順暢的體驗(這是效能問題),而且用得起(這是成本問題)等等。
鑑於此,我們策劃了這場以 RAG 技術為主題的圓桌討論活動,旨在探討 RAG 技術的當前進展、面臨的挑戰、未來的發展方向以及在不同行業中的應用潛力。
7 月 10 日 20:00-21:30
都說 RAG “爛大街”了,但為何深度應用寥寥無幾?
-
主持人:郭瑞傑 阿里巴巴總監 & TGO 鯤鵬會學員
-
嘉賓:1.歐明棟 阿里雲 /高階演算法專家2.張穎峰 英飛流 /CEO3.常揚 合合資訊 /智慧創新事業部研發總監
-
RAG 技術在不同行業中的應用差異、挑戰及潛在影響
-
RAG 技術真的“爛大街”了?對 RAG 技術的深入理解
-
基於 Agent 的高階 RAG,針對複雜問題的解法
-
RAG 技術未來的發展預測與暢想
掃描下圖海報【二維碼】,或戳直播預約按鈕,預約 InfoQ 影片號直播。👇

更多精彩內容,歡迎持續關注 8 月 18-19 日的 AICon 上海站,屆時,幾位老師將帶來如下分享:
RAG(檢索增強生成)是大模型應用的重要方向,它大幅緩解了大模型幻覺、資訊更新不及時、專業域或私有域知識匱乏等問題,顯著提升了大模型在知識庫問答、網頁搜尋、客服等領域的可信賴度。但我們發現,在實際落地中,RAG 仍存在不少問題,如:文件解析結構丟失、大模型生成幻覺、複雜問題無法解答等等,本次演講我將主要分享以上問題的解決方案,希望能給大家帶來一些啟發和思考。
演講提綱
-
RAG 技術背景及應用場景介紹; -
文件結構化:基於大模型的文件層次結構提取; -
RAG 場景生成幻覺最佳化:面向 RAG 的大模型微調; -
RAG Agent 探索:基於 Agent 的自適應 RAG; -
RAG 案例解析; -
總結與展望
聽眾收益
-
阿里雲 AI 搜尋 RAG 在實際應用場景中碰到的問題及嘗試的解決方案
-
阿里雲 AI 搜尋 RAG 大模型最佳化實踐中的失敗和成功經驗
越來越多的企業利用大模型構建專屬領域的知識問答型機器人。透過使用 RAG 和提示工程技術,企業可以快速基於預訓練大模型構建功能和產品,但隨著業務量和場景的增加,其效能受到多種因素制約,比如大模型呼叫成本、多場景支援、法務合規等。本次演講將介紹我們透過大模型微調,完成 GPT-3.5 / 開源模型完全替換 GPT-4 的實踐和經驗,並展望未來發展方向。
演講提綱
-
系統架構的演進
-
RAG 系統的問題
-
子模組的指標設計
-
資料問題及解決方案
-
微調技術實踐
-
微調後調優與測試
-
總結與展望
聽眾收益
-
瞭解 RAG 和微調的異同與適用場景 -
瞭解大模型微調的技術難點和實踐經驗 -
瞭解微調的副作用以及微調後調優策略
演講主題:向量化與文件解析技術加速大模型 RAG 應用落地
大模型落地應用中,RAG(Retrieval-Augmented Generation)與大模型文件相關 Agent 在落地時常遇到文件無法正確解析、表格公式目錄等文件元素解析丟失、知識庫文件解析速度慢、機械分 chunk 丟失語義資訊、目標內容召回不到等問題,極大影響了 RAG 落地應用效果與使用者體驗。
本次演講從 RAG 應用落地時常見問題與需求(文件解析、檢索精度)出發,介紹針對性的高精度、高泛化性、多版面多元素識別支援的文件解析技術方案與整合長文件解析引擎、層級切片技術的向量化 Embedding 模型技術方案,最後分享開放域多模態資訊抽取應用與知識庫問答應用等實際場景的產品實踐案例。
演講提綱
-
RAG 落地時的常見的問題與需求
-
文件解析技術 + 向量化技術的研究內容
-
文件解析技術方案介紹
-
向量化 Embedding 模型技術介紹
-
實際場景產品實踐案例
聽眾收益
-
深入瞭解 RAG 應用落地的挑戰與解決方案
-
掌握文件解析與向量化 Embedding 模型技術邏輯與原理
-
透過 RAG 應用落地的案例分享,獲得實踐經驗
RAG 1.0 是以 LLMOps 為核心的 RAG 編排系統,透過把各種元件如 Embedding 模型,向量資料庫等編排在一起,快速讓使用者搭建起原型。然而在面向企業級場景使用的時候,常常會面臨各種問題卻無法應對。RAG 2.0 是以搜尋為核心的端到端系統,它將整個 RAG 按照搜尋的典型流程劃分為若干階段:包含資料的資訊抽取、文件預處理、構建索引、以及檢索,並且每個環節都圍繞一系列模型協同工作。本次分享主要帶來 InfiniFlow 在這些環節的具體進展,並介紹如何打造標準化的企業級 RAG 2.0 產品。
演講提綱
-
RAG 1.0 的痛點 -
以搜尋為中心的 RAG 2.0 -
資料抽取模型——實現與演進 -
文件預處理模型 -
知識圖譜 -
聚類 -
Embedding 的選擇與微調 -
召回和排序 -
全文搜尋 -
Blended RAG 三路召回 -
Tensor 召回與 Cross Encoder -
Agent 與 Agentic RAG -
RAG 的未來發展
聽眾收益
-
如何解決 RAG 落地場景的技術挑戰
-
如何實現企業級 RAG 和 Agent

在主題演講環節,我們已經邀請到了「蔚來創始人 李斌」,分享基於蔚來汽車 10 年來創新創業過程中的思考和實踐,聚焦 SmartEV 和 AI 結合的關鍵問題和解決之道。大會火熱報名中,7 月 31 日前可以享受 9 折優惠,單張門票節省 480 元(原價 4800 元),詳情可聯絡票務經理 13269078023 諮詢。
