語料一變就崩?EraRAG首創“增量語義圖”,動態語料場景下也能穩準快

在檢索增強生成(RAG)成為提升大語言模型知識能力的重要正規化的當下,圖結構 RAG 被廣泛認為是支援多跳推理與深層理解的關鍵路徑。
然而,現有的 Graph-RAG 方法普遍建立在靜態語料假設之上,一旦面對持續增長的知識庫,其圖結構往往難以維護,更新代價高昂,嚴重限制了在真實場景中的應用落地。
這一靜態構建正規化隱含地認為圖結構一經建立即可長期複用,忽略了語料動態演化過程中對圖結構的一致性、可控性與可擴充套件性的挑戰。
尤其是在新聞資訊、科研論文、使用者生成內容等高頻更新的語料場景下,傳統 Graph-RAG 模型在更新效率與語義完整性之間難以取得平衡,導致系統性能難以持續最佳化。
為突破這一關鍵瓶頸,我們提出 EraRAG(Efficient and Incremental Retrieval-Augmented Generation),一種專為動態語料設計的高效圖結構 RAG 框架。
本文由華為香港研究院、香港科技大學、香港中文大學(深圳)、香港中文大學、湖南大學、微眾銀行聯合完成。
論文標題:
EraRAG: Efficient and Incremental Retrieval Augmented Generation for Growing Corpora
論文連結:
https://arxiv.org/abs/2506.20963
專案連結:
https://github.com/EverM0re/EraRAG-Official
EraRAG 創新性地引入超平面雜湊與遞迴摘要機制,首次實現了語義一致、結構穩定且支援增量更新的層次化知識圖構建方式,有效彌合了檢索效率與圖結構可維護性之間的矛盾,在保持靜態精確度的同時支援穩定動態新增,為構建可擴充套件、可部署、可演化的 RAG 系統提供了新路徑。
為何需要EraRAG:現有方法的侷限與革新
Graph-RAG 已經在增強大語言模型知識能力方面取得了顯著進展,但現有方法普遍假設語料庫是靜態不變的,難以適應實際中語料持續增長的需求。
一旦新增內容到來,常見做法往往需要整體重構圖結構,帶來巨大的計算和儲存開銷,也破壞了原有結構的語義穩定性。同時,傳統圖構建過程多依賴社群檢測或聚類演算法,不僅計算複雜,而且在增量場景下缺乏可重複性,容易導致圖結構漂移。
此外,現有方法在語義粒度控制方面也較為粗放,難以同時兼顧細節與抽象語義,影響多跳推理與長文字理解效果。
EraRAG 針對這些核心痛點進行了系統性設計。它以超平面 LSH 替代傳統聚類,提供了高效、可復現的語義分段方式,並透過多層摘要構建出結構清晰、粒度可調的語義圖譜。
在更新階段,EraRAG 可精確定位受影響的區域性區域,僅在必要範圍內觸發圖結構與摘要的調整,從而顯著降低更新代價並保持整體語義一致性。
這種可擴充套件、可維護的設計使 EraRAG 成為首個真正支援動態語料的高效 Graph-RAG 框架,為實際部署提供了更具可行性的解決方案。
為動態語料而設計的高效圖結構RAG框架
面對圖結構 RAG 在動態語料場景中的可擴充套件性瓶頸,EraRAG 提出了一種分層構圖、可增量更新的解決方案,實現了檢索效率、表示能力與更新代價之間的平衡。
其關鍵設計在於結合超平面區域性敏感雜湊(Hyperplane-based LSH)與遞迴語義摘要機制,將大規模文字組織為結構緊湊、可區域性維護的層次化語義圖。
EraRAG 的整體流程自底向上展開。首先對原始語料進行分塊處理,劃分為較短文字片段(chunk),並使用固定的文字編碼器(如 BGE-M3)生成歸一化嵌入向量。
隨後,系統透過投影這些嵌入到一組固定的隨機超平面上,得到每個向量的雜湊簽名,依據雜湊結果將相似文字自動聚集進同一桶(bucket)。
為保證桶的語義一致性和大小均衡,EraRAG 採用可控的分段策略,對超大桶進行劃分、對小桶進行合併,從而形成初始的語義段(segment)。
在圖構建階段,系統對每個段呼叫 LLM 執行摘要,將其內容概括為更高層次的語義節點,並生成新的嵌入,遞迴執行同樣的雜湊、分段與摘要流程,逐層向上構建出多層次的圖結構。
每一層代表一個語義抽象層級,最底層保留原始文字粒度,而越往上則越接近概括性和結構化語義。這一分層結構既可支援高效檢索,也具備跨粒度適配不同任務型別(如細節問答 vs. 長文理解)的能力。
在應對語料增長方面,EraRAG 引入了局部可控的圖更新機制。新增文字經過相同的編碼與雜湊流程被插入對應桶中,只需更新受影響的段與其父節點,並在圖中進行區域性傳播重構,避免對整個圖進行全量更新。
由於 EraRAG 在構建圖時保留了原始的超平面投影引數,這使得每次增量插入都具有高度一致性與可重複性。整個更新流程可以在常數數量的段內區域性完成,計算和 token 消耗顯著降低。
得益於這一分層組織與增量更新策略,EraRAG 可在無需重訓練或全圖重構的前提下,快速適配語料動態變化,並保持圖結構的語義一致性與表示完整性,在新聞、社交內容、學術文獻等不斷增長的實際場景中具備良好的落地潛力。
實驗評估:效率與精度雙突破
我們在多個具有代表性的問答資料集上對 EraRAG 進行了全面評估,涵蓋了事實檢索、多跳推理、長文理解等典型任務。實驗從靜態圖構建和動態語料更新兩個方面出發,重點考察系統在真實語料增長場景下的適應性與穩健性。
結果表明,EraRAG 在效率上顯著優於現有的圖結構 RAG 方法。在面對不斷擴充套件的語料庫時,其增量更新機制能夠避免重複計算與結構重建,僅需對新增部分進行區域性調整,從而有效降低計算開銷與儲存成本,展現出良好的可擴充套件性和實用性。
在精度方面,EraRAG 同樣展現出領先優勢。得益於其層次化語義建模和結構化表示,系統能夠更準確地捕捉文字中的關鍵線索與多跳關係,顯著提升了對複雜問題的理解與生成能力,在多種任務上都取得了優於現有方法的表現。
此外,在動態語料新增過程中,EraRAG 能夠持續穩健地吸收新知識,系統性能隨新增語料穩步提升,最終達到與靜態構建相當的準確度。
這充分說明 EraRAG 在結構層次與語義一致性方面具備良好魯棒性,即便在不斷變化的知識環境中,也能保持穩定可靠的效能表現。
潛在侷限與未來發展方向
儘管 EraRAG 在多跳推理與動態語料更新任務中展現出優越效能,其方法仍存在一定邊界。
例如,系統在構建初始圖時對語料覆蓋度有較高要求,若初始結構過於稀疏,後續插入可能影響整體語義一致性。同時,多層圖的摘要過程依賴大型語言模型,在低資源或跨語言場景下可能面臨計算瓶頸。
此外,當前方法主要聚焦於文字模態,尚未覆蓋影像、影片等多模態場景,限制了在更復雜應用中的擴充套件性。
未來,我們計劃從多個方向拓展 EraRAG 的能力,包括在低語料下提升圖初始化的穩定性,推動摘要模組的輕量化與部署效率,以及探索向影像、音訊等模態擴充套件的統一圖結構構建方法。
同時,我們也將進一步最佳化檢索策略,使其更靈活地適配不同型別任務,提升系統在理解與生成上的整體表現。
我們相信,EraRAG 為構建可增量、可擴充套件的多模態語義檢索系統提供了堅實基礎,值得在更廣泛的真實場景中深入探索與實踐。
更多閱讀
#投 稿 通 道#
 讓你的文字被更多人看到 
如何才能讓更多的優質內容以更短路徑到達讀者群體,縮短讀者尋找優質內容的成本呢?答案就是:你不認識的人。
總有一些你不認識的人,知道你想知道的東西。PaperWeekly 或許可以成為一座橋樑,促使不同背景、不同方向的學者和學術靈感相互碰撞,迸發出更多的可能性。 
PaperWeekly 鼓勵高校實驗室或個人,在我們的平臺上分享各類優質內容,可以是最新論文解讀,也可以是學術熱點剖析科研心得競賽經驗講解等。我們的目的只有一個,讓知識真正流動起來。
📝 稿件基本要求:
• 文章確係個人原創作品,未曾在公開渠道發表,如為其他平臺已發表或待發表的文章,請明確標註 
• 稿件建議以 markdown 格式撰寫,文中配圖以附件形式傳送,要求圖片清晰,無版權問題
• PaperWeekly 尊重原作者署名權,並將為每篇被採納的原創首發稿件,提供業內具有競爭力稿酬,具體依據文章閱讀量和文章質量階梯制結算
📬 投稿通道:
• 投稿郵箱:[email protected] 
• 來稿請備註即時聯絡方式(微信),以便我們在稿件選用的第一時間聯絡作者
• 您也可以直接新增小編微信(pwbot02)快速投稿,備註:姓名-投稿
△長按新增PaperWeekly小編
🔍
現在,在「知乎」也能找到我們了
進入知乎首頁搜尋「PaperWeekly」
點選「關注」訂閱我們的專欄吧
·


相關文章