語料一變就崩？EraRAG首創“增量語義圖”，動態語料場景下也能穩準快

在檢索增強生成（RAG）成為提升大語言模型知識能力的重要正規化的當下，圖結構 RAG 被廣泛認為是支援多跳推理與深層理解的關鍵路徑。

然而，現有的 Graph-RAG 方法普遍建立在靜態語料假設之上，一旦面對持續增長的知識庫，其圖結構往往難以維護，更新代價高昂，嚴重限制了在真實場景中的應用落地。

這一靜態構建正規化隱含地認為圖結構一經建立即可長期複用，忽略了語料動態演化過程中對圖結構的一致性、可控性與可擴充套件性的挑戰。

尤其是在新聞資訊、科研論文、使用者生成內容等高頻更新的語料場景下，傳統 Graph-RAG 模型在更新效率與語義完整性之間難以取得平衡，導致系統性能難以持續最佳化。

為突破這一關鍵瓶頸，我們提出 EraRAG（Efficient and Incremental Retrieval-Augmented Generation），一種專為動態語料設計的高效圖結構 RAG 框架。

本文由華為香港研究院、香港科技大學、香港中文大學（深圳）、香港中文大學、湖南大學、微眾銀行聯合完成。

論文標題：

EraRAG: Efficient and Incremental Retrieval Augmented Generation for Growing Corpora

論文連結：

https://arxiv.org/abs/2506.20963

專案連結：

https://github.com/EverM0re/EraRAG-Official

EraRAG 創新性地引入超平面雜湊與遞迴摘要機制，首次實現了語義一致、結構穩定且支援增量更新的層次化知識圖構建方式，有效彌合了檢索效率與圖結構可維護性之間的矛盾，在保持靜態精確度的同時支援穩定動態新增，為構建可擴充套件、可部署、可演化的 RAG 系統提供了新路徑。

為何需要EraRAG：現有方法的侷限與革新

Graph-RAG 已經在增強大語言模型知識能力方面取得了顯著進展，但現有方法普遍假設語料庫是靜態不變的，難以適應實際中語料持續增長的需求。

一旦新增內容到來，常見做法往往需要整體重構圖結構，帶來巨大的計算和儲存開銷，也破壞了原有結構的語義穩定性。同時，傳統圖構建過程多依賴社群檢測或聚類演算法，不僅計算複雜，而且在增量場景下缺乏可重複性，容易導致圖結構漂移。

此外，現有方法在語義粒度控制方面也較為粗放，難以同時兼顧細節與抽象語義，影響多跳推理與長文字理解效果。

EraRAG 針對這些核心痛點進行了系統性設計。它以超平面 LSH 替代傳統聚類，提供了高效、可復現的語義分段方式，並透過多層摘要構建出結構清晰、粒度可調的語義圖譜。

在更新階段，EraRAG 可精確定位受影響的區域性區域，僅在必要範圍內觸發圖結構與摘要的調整，從而顯著降低更新代價並保持整體語義一致性。

這種可擴充套件、可維護的設計使 EraRAG 成為首個真正支援動態語料的高效 Graph-RAG 框架，為實際部署提供了更具可行性的解決方案。

為動態語料而設計的高效圖結構RAG框架

面對圖結構 RAG 在動態語料場景中的可擴充套件性瓶頸，EraRAG 提出了一種分層構圖、可增量更新的解決方案，實現了檢索效率、表示能力與更新代價之間的平衡。

其關鍵設計在於結合超平面區域性敏感雜湊（Hyperplane-based LSH）與遞迴語義摘要機制，將大規模文字組織為結構緊湊、可區域性維護的層次化語義圖。

EraRAG 的整體流程自底向上展開。首先對原始語料進行分塊處理，劃分為較短文字片段（chunk），並使用固定的文字編碼器（如 BGE-M3）生成歸一化嵌入向量。

隨後，系統透過投影這些嵌入到一組固定的隨機超平面上，得到每個向量的雜湊簽名，依據雜湊結果將相似文字自動聚集進同一桶（bucket）。

為保證桶的語義一致性和大小均衡，EraRAG 採用可控的分段策略，對超大桶進行劃分、對小桶進行合併，從而形成初始的語義段（segment）。

在圖構建階段，系統對每個段呼叫 LLM 執行摘要，將其內容概括為更高層次的語義節點，並生成新的嵌入，遞迴執行同樣的雜湊、分段與摘要流程，逐層向上構建出多層次的圖結構。

每一層代表一個語義抽象層級，最底層保留原始文字粒度，而越往上則越接近概括性和結構化語義。這一分層結構既可支援高效檢索，也具備跨粒度適配不同任務型別（如細節問答 vs. 長文理解）的能力。

在應對語料增長方面，EraRAG 引入了局部可控的圖更新機制。新增文字經過相同的編碼與雜湊流程被插入對應桶中，只需更新受影響的段與其父節點，並在圖中進行區域性傳播重構，避免對整個圖進行全量更新。

由於 EraRAG 在構建圖時保留了原始的超平面投影引數，這使得每次增量插入都具有高度一致性與可重複性。整個更新流程可以在常數數量的段內區域性完成，計算和 token 消耗顯著降低。

得益於這一分層組織與增量更新策略，EraRAG 可在無需重訓練或全圖重構的前提下，快速適配語料動態變化，並保持圖結構的語義一致性與表示完整性，在新聞、社交內容、學術文獻等不斷增長的實際場景中具備良好的落地潛力。

實驗評估：效率與精度雙突破

我們在多個具有代表性的問答資料集上對 EraRAG 進行了全面評估，涵蓋了事實檢索、多跳推理、長文理解等典型任務。實驗從靜態圖構建和動態語料更新兩個方面出發，重點考察系統在真實語料增長場景下的適應性與穩健性。

結果表明，EraRAG 在效率上顯著優於現有的圖結構 RAG 方法。在面對不斷擴充套件的語料庫時，其增量更新機制能夠避免重複計算與結構重建，僅需對新增部分進行區域性調整，從而有效降低計算開銷與儲存成本，展現出良好的可擴充套件性和實用性。

在精度方面，EraRAG 同樣展現出領先優勢。得益於其層次化語義建模和結構化表示，系統能夠更準確地捕捉文字中的關鍵線索與多跳關係，顯著提升了對複雜問題的理解與生成能力，在多種任務上都取得了優於現有方法的表現。

此外，在動態語料新增過程中，EraRAG 能夠持續穩健地吸收新知識，系統性能隨新增語料穩步提升，最終達到與靜態構建相當的準確度。

這充分說明 EraRAG 在結構層次與語義一致性方面具備良好魯棒性，即便在不斷變化的知識環境中，也能保持穩定可靠的效能表現。

潛在侷限與未來發展方向

儘管 EraRAG 在多跳推理與動態語料更新任務中展現出優越效能，其方法仍存在一定邊界。

例如，系統在構建初始圖時對語料覆蓋度有較高要求，若初始結構過於稀疏，後續插入可能影響整體語義一致性。同時，多層圖的摘要過程依賴大型語言模型，在低資源或跨語言場景下可能面臨計算瓶頸。

此外，當前方法主要聚焦於文字模態，尚未覆蓋影像、影片等多模態場景，限制了在更復雜應用中的擴充套件性。

未來，我們計劃從多個方向拓展 EraRAG 的能力，包括在低語料下提升圖初始化的穩定性，推動摘要模組的輕量化與部署效率，以及探索向影像、音訊等模態擴充套件的統一圖結構構建方法。

同時，我們也將進一步最佳化檢索策略，使其更靈活地適配不同型別任務，提升系統在理解與生成上的整體表現。

我們相信，EraRAG 為構建可增量、可擴充套件的多模態語義檢索系統提供了堅實基礎，值得在更廣泛的真實場景中深入探索與實踐。

更多閱讀

#投稿通道#

讓你的文字被更多人看到

如何才能讓更多的優質內容以更短路徑到達讀者群體，縮短讀者尋找優質內容的成本呢？答案就是：你不認識的人。

總有一些你不認識的人，知道你想知道的東西。PaperWeekly 或許可以成為一座橋樑，促使不同背景、不同方向的學者和學術靈感相互碰撞，迸發出更多的可能性。

PaperWeekly 鼓勵高校實驗室或個人，在我們的平臺上分享各類優質內容，可以是最新論文解讀，也可以是學術熱點剖析、科研心得或競賽經驗講解等。我們的目的只有一個，讓知識真正流動起來。

📝 稿件基本要求：

• 文章確係個人原創作品，未曾在公開渠道發表，如為其他平臺已發表或待發表的文章，請明確標註

• 稿件建議以 markdown 格式撰寫，文中配圖以附件形式傳送，要求圖片清晰，無版權問題

• PaperWeekly 尊重原作者署名權，並將為每篇被採納的原創首發稿件，提供業內具有競爭力稿酬，具體依據文章閱讀量和文章質量階梯制結算

📬 投稿通道：

• 投稿郵箱：[email protected]

• 來稿請備註即時聯絡方式（微信），以便我們在稿件選用的第一時間聯絡作者

• 您也可以直接新增小編微信（pwbot02）快速投稿，備註：姓名-投稿

△長按新增PaperWeekly小編

🔍

現在，在「知乎」也能找到我們了

進入知乎首頁搜尋「PaperWeekly」

點選「關注」訂閱我們的專欄吧

dignews.cc

語料一變就崩？EraRAG首創“增量語義圖”，動態語料場景下也能穩準快

相關文章

RAG終極框架！港大開源RAG-Anything：統一多模態知識圖譜

全模態RAG突破文字侷限，港大構建跨模態一體化系統

最全梳理：一文搞懂RAG技術的5種正規化！

讓DeepSeek更可靠！清華提出Hyper-RAG，用超圖提升知識建模精準度

港大最新研究成果：MiniRAG，「迷你版」RAG小模型端側可用

RAG2.0深入解讀

PIKE-RAG：解鎖領域私有資料價值，推動LLMs工業應用落地

RAG七十二式：2024年度RAG清單

下一代RAG技術來了！微軟正式開源GraphRAG：大模型行業將迎來新的升級？

淺談DeepSeek與Lakehouse的跨越式融合