港中大（深圳）、華為雲聯合突破！首次提出GraphRAG統一框架

研究背景

研究問題：這篇文章要解決的問題是如何在統一框架下對基於圖的檢索增強生成（RAG）方法進行系統的比較和分析。具體來說，現有的基於圖的 RAG 方法沒有在同一實驗設定下進行系統的比較。

研究難點：該問題的研究難點包括：缺乏統一的框架來抽象和比較各種基於圖的 RAG 方法；現有工作主要關注整體效能評估，而非單個元件的效能；缺乏對各種方法在準確性和效率方面的全面比較。

相關工作：該問題的研究相關工作有：RAG 技術在各種領域的廣泛應用，如醫療保健、金融和教育；已有的基於圖的 RAG 方法，如 RAPTOR、KGP、HippoRAG 等，但這些方法缺乏系統的比較和分析。

論文標題：

In-depth Analysis of Graph-based RAG in a Unified Framework

論文地址：

https://arxiv.org/abs/2503.04338

程式碼地址：

https://github.com/JayLZhou/GraphRAG

研究方法

這篇論文提出了一個統一的框架，用於解決基於圖的 RAG 方法的系統比較和分析問題。具體來說：

1. 圖構建：首先，將大規模語料庫分割成多個塊，然後使用 LLM 或其他工具從這些塊中提取節點和邊，構建圖。圖的型別包括 passage graph、tree、knowledge graph、textual knowledge graph 和 rich knowledge graph。

2. 索引構建：為了支援高效的線上查詢，構建索引以儲存圖中的實體或關係，並計算社群報告以實現高效的線上檢索。索引型別包括節點索引、關係索引和社群索引。

3. 運算子配置：在統一框架下，任何現有的基於圖的 RAG 方法都可以透過選擇特定的運算子並將其組合來實現。運算子分為節點型別、關係型別、塊型別、子圖型別和社群型別。

4. 檢索與生成：在檢索與生成階段，首先將使用者輸入的問題轉換為檢索原語，然後使用選定的運算子檢索相關資訊，並將其與問題一起輸入 LLM 以生成答案。答案生成有兩種正規化：直接生成和 Map-Reduce。

實驗設計

1. 資料集：實驗使用了 11 個真實世界的資料集，包括特定問題和抽象問題的資料集。資料集如 MultihopQA、Quality、PopQA、MusiqueQA、HotpotQA、ALCE、Mix、MultihopSum、Agriculture、CS 和 Legal。

2. 評估指標：對於特定問題任務，使用準確率和召回率進行評估；對於抽象問題任務，使用包括全面性、多樣性、賦能和總體質量在內的多維度比較方法進行評估。

3. 實現：所有演算法在 Python 中實現，並使用提出的統一框架。實驗在 350 集。資料集如 MultihopQA、Quality、PopQA、MusiqueQA、HotpotQA、ALCE、Mix、MultihopSum、Agriculture、CS 和 Legal。

4. 超引數設定：對於需要 top-k 選擇的每種方法（例如塊或實體），設定 k=4 以適應令牌長度限制。使用最先進的文字編碼模型 BGE-M3 生成圖的節點和關係的嵌入向量。

結果與分析

1. 特定問題任務的效能：RAG 技術顯著提高了 LLM 在所有資料集上的效能，基於圖的 RAG 方法通常比 Vanila RAG 具有更高的準確性。例如，在 Quality 資料集上，RAPTOR 相比 ZeroShot 提高了 53.80% 的準確性。然而，如果檢索到的元素與給定問題不相關，RAG 可能會降低 LLM 的準確性。

2. 圖構建和索引構建的成本：構建樹所需的令牌成本最低，而 TKG 和 RKG 的令牌成本最高。對於大型資料集，離線階段的兩種版本的 GraphRAG 通常比其他方法消耗更多的令牌。

3. 生成成本：ZeroShot 和 VanilaRAG 在時間和令牌消耗方面是最具成本效益的方法。KGP 和 ToG 是最昂貴的方法，因為它們依賴於 LLM 進行資訊檢索。

4. 複雜問題任務的新 SOTA 演算法：基於上述分析，設計了新的 SOTA 方法 VGraphRAG，透過結合四種元素（實體、關係、社群和塊）來有效地指導 LLM 生成準確的答案。在 ALCE 資料集上，VGraphRAG 在 STRREC、STREM 和 STRHIT 方面分別提高了 8.47%、13.18% 和 4.93%。