港中大(深圳)、華為雲聯合突破!首次提出GraphRAG統一框架

研究背景
研究問題:這篇文章要解決的問題是如何在統一框架下對基於圖的檢索增強生成(RAG)方法進行系統的比較和分析。具體來說,現有的基於圖的 RAG 方法沒有在同一實驗設定下進行系統的比較。
研究難點:該問題的研究難點包括:缺乏統一的框架來抽象和比較各種基於圖的 RAG 方法;現有工作主要關注整體效能評估,而非單個元件的效能;缺乏對各種方法在準確性和效率方面的全面比較。
相關工作:該問題的研究相關工作有:RAG 技術在各種領域的廣泛應用,如醫療保健、金融和教育;已有的基於圖的 RAG 方法,如 RAPTOR、KGP、HippoRAG 等,但這些方法缺乏系統的比較和分析。
論文標題:
In-depth Analysis of Graph-based RAG in a Unified Framework
論文地址:
https://arxiv.org/abs/2503.04338
程式碼地址:
https://github.com/JayLZhou/GraphRAG
研究方法
這篇論文提出了一個統一的框架,用於解決基於圖的 RAG 方法的系統比較和分析問題。具體來說:
1. 圖構建:首先,將大規模語料庫分割成多個塊,然後使用 LLM 或其他工具從這些塊中提取節點和邊,構建圖。圖的型別包括 passage graph、tree、knowledge graph、textual knowledge graph 和 rich knowledge graph。
2. 索引構建:為了支援高效的線上查詢,構建索引以儲存圖中的實體或關係,並計算社群報告以實現高效的線上檢索。索引型別包括節點索引、關係索引和社群索引。
3. 運算子配置:在統一框架下,任何現有的基於圖的 RAG 方法都可以透過選擇特定的運算子並將其組合來實現。運算子分為節點型別、關係型別、塊型別、子圖型別和社群型別。
4. 檢索與生成:在檢索與生成階段,首先將使用者輸入的問題轉換為檢索原語,然後使用選定的運算子檢索相關資訊,並將其與問題一起輸入 LLM 以生成答案。答案生成有兩種正規化:直接生成和 Map-Reduce。
實驗設計
1. 資料集:實驗使用了 11 個真實世界的資料集,包括特定問題和抽象問題的資料集。資料集如 MultihopQA、Quality、PopQA、MusiqueQA、HotpotQA、ALCE、Mix、MultihopSum、Agriculture、CS 和 Legal。
2. 評估指標:對於特定問題任務,使用準確率和召回率進行評估;對於抽象問題任務,使用包括全面性、多樣性、賦能和總體質量在內的多維度比較方法進行評估。
3. 實現:所有演算法在 Python 中實現,並使用提出的統一框架。實驗在 350 集。資料集如 MultihopQA、Quality、PopQA、MusiqueQA、HotpotQA、ALCE、Mix、MultihopSum、Agriculture、CS 和 Legal。
4. 超引數設定:對於需要 top-k 選擇的每種方法(例如塊或實體),設定 k=4 以適應令牌長度限制。使用最先進的文字編碼模型 BGE-M3 生成圖的節點和關係的嵌入向量。
結果與分析
1. 特定問題任務的效能:RAG 技術顯著提高了 LLM 在所有資料集上的效能,基於圖的 RAG 方法通常比 Vanila RAG 具有更高的準確性。例如,在 Quality 資料集上,RAPTOR 相比 ZeroShot 提高了 53.80% 的準確性。然而,如果檢索到的元素與給定問題不相關,RAG 可能會降低 LLM 的準確性。
2. 圖構建和索引構建的成本:構建樹所需的令牌成本最低,而 TKG 和 RKG 的令牌成本最高。對於大型資料集,離線階段的兩種版本的 GraphRAG 通常比其他方法消耗更多的令牌。
3. 生成成本:ZeroShot 和 VanilaRAG 在時間和令牌消耗方面是最具成本效益的方法。KGP 和 ToG 是最昂貴的方法,因為它們依賴於 LLM 進行資訊檢索。
4. 複雜問題任務的新 SOTA 演算法:基於上述分析,設計了新的 SOTA 方法 VGraphRAG,透過結合四種元素(實體、關係、社群和塊)來有效地指導 LLM 生成準確的答案。在 ALCE 資料集上,VGraphRAG 在 STRREC、STREM 和 STRHIT 方面分別提高了 8.47%、13.18% 和 4.93%。
5. 抽象問題任務的效能:基於圖的 RAG 方法通常優於 VanillaRAG,主要原因是它們有效地捕捉了塊之間的相互連線。GGraphRAG 和 RAPTOR通常優於 HLightRAG 和 FastGraphRAG,因為它們將高層次的總結文字納入提示中。
6. 新 SOTA 演算法的成本效益:設計了一個成本效益更高的版本 CheapRAG,透過選擇最有用的社群和塊來顯著減少令牌成本。在 MultihopSum 資料集上 CheapRAG 相比 GGraphRAG 減少了 100 倍的令牌成本,同時提高了答案質量。
總體結論
這篇論文提供了對現有基於圖的 RAG 方法的深入實驗評估和比較。首先,提出了一個新的統一框架,可以涵蓋所有現有的基於圖的 RAG 方法。然後,在統一框架下對各種基於圖的 RAG 方法進行了深入分析和比較。
此外,透過多種資料集從不同角度系統地評估了這些方法,並透過結合現有技術開發了變體,這些變體通常優於最先進的方法。
從廣泛的實驗結果和分析中,識別了幾個重要的發現並分析了影響效能的關鍵元件。最後,總結了所學到的教訓並提出了促進未來研究的實際研究機會。
核心創新
1. 統一框架:提出了一個新穎的統一框架,涵蓋所有現有的基於圖的檢索增強生成(RAG)方法,從高層次角度抽象出幾個關鍵操作。
2. 全面比較:在統一框架下系統地比較了 12 種代表性的基於圖的 RAG 方法,提供了對這些方法的深入分析。
3. 新變體識別:透過結合現有技術,識別出新的基於圖的 RAG 方法變體,這些變體在某些任務上優於最先進的方法。
4. 實驗設計:在多個廣泛使用的問答(QA)資料集上進行了全面的實驗,評估了這些方法處理不同型別查詢的能力,並進行了深入分析。
5. 模組化設計:框架的模組化設計允許不同演算法在各個階段無縫整合,確保每個階段(如圖構建、檢索和生成)可以獨立最佳化和重組。
6. 運算子設計:透過調整檢索階段或交換元件,研究人員可以快速測試和實施新策略,顯著加速檢索增強模型的開發週期。
7. 標準化評估:提供了一個標準化的方法來評估基於圖的 RAG 方法,確保了可重複性,促進了公平的基準測試,併為未來的 RAG 基礎 LLM 應用的創新提供了便利。
更多閱讀
#投 稿 通 道#
 讓你的文字被更多人看到 
如何才能讓更多的優質內容以更短路徑到達讀者群體,縮短讀者尋找優質內容的成本呢?答案就是:你不認識的人。
總有一些你不認識的人,知道你想知道的東西。PaperWeekly 或許可以成為一座橋樑,促使不同背景、不同方向的學者和學術靈感相互碰撞,迸發出更多的可能性。 
PaperWeekly 鼓勵高校實驗室或個人,在我們的平臺上分享各類優質內容,可以是最新論文解讀,也可以是學術熱點剖析科研心得競賽經驗講解等。我們的目的只有一個,讓知識真正流動起來。
📝 稿件基本要求:
• 文章確係個人原創作品,未曾在公開渠道發表,如為其他平臺已發表或待發表的文章,請明確標註 
• 稿件建議以 markdown 格式撰寫,文中配圖以附件形式傳送,要求圖片清晰,無版權問題
• PaperWeekly 尊重原作者署名權,並將為每篇被採納的原創首發稿件,提供業內具有競爭力稿酬,具體依據文章閱讀量和文章質量階梯制結算
📬 投稿通道:
• 投稿郵箱:[email protected] 
• 來稿請備註即時聯絡方式(微信),以便我們在稿件選用的第一時間聯絡作者
• 您也可以直接新增小編微信(pwbot02)快速投稿,備註:姓名-投稿
△長按新增PaperWeekly小編
🔍
現在,在「知乎」也能找到我們了
進入知乎首頁搜尋「PaperWeekly」
點選「關注」訂閱我們的專欄吧
·


相關文章