2024:大模型背景下知識圖譜的理性迴歸

OSCHINA
↑點選藍字 關注我們
最近,開源中國 OSCHINA、Gitee 與 Gitee AI 聯合釋出了《2024 中國開源開發者報告》
報告聚焦 AI 大模型領域,對過去一年的技術演進動態、技術趨勢、以及開源開發者生態資料進行多方位的總結和梳理。
在第二章《TOP 101-2024 大模型觀點》中,螞蟻集團知識引擎負責人,KAG 專案負責人梁磊認為,隨著大模型訓練正規化從預訓練(Pre-training)階段向後訓練(Post-Training)階段的遷移,人們的關注焦點也逐漸從語言模型的生成能力越來越多轉向推理能力。
這一轉變的本質是更加重視模型理解和處理複雜問題的能力。可以預見,2025 年基於知識圖譜 + 大語言模型的垂域推理應用和開源專案將越來越多的湧現,為垂直領域的複雜問題問答推理提供新的解決方案。
全文如下:

2024:大模型背景下知識圖譜的理性迴歸

文 / 梁磊
2024 年 11 月 30 日,適逢 GPT 3.5 釋出兩週年,在過去的兩年時間裡,國內的大模型產業在基座模型、智慧體(Agent)技術以及檢索增強生成(RAG)等方面都取得了顯著的進步,並催生了眾多優秀的開源專案。
隨著越來越多高質量和多樣化的資料被加入到預訓練資料中,如通義千問、DeepSeek、文心一言、螞蟻百靈等基座大模型在知識掌握、推理能力和理解水平上都有了顯著的提升,在諸多榜單和真實問題上展現出了超越 GPT-4o 的水平。
然而,大模型幻覺、資料時效性、隱私安全、以及推理解釋性等問題並沒有隨著模型能力越來越強而消失,這些問題仍然存在並嚴重阻礙著大語言模型在垂直領域的應用。這也造就了模型越來越強,垂直領域的殺手級應用依然沒有出現的怪象。
為了應對這些問題挑戰,行業及社群都在不斷的積極探索外部知識庫與大型語言模型的方式來尋找解決方案。在此過程中,湧現出了許多出色的開源專案,它們的技術路徑大致可以分為兩類:一類是基於搜尋引擎技術的改進,另一類則是基於知識圖譜技術的發展。
以搜尋引擎為基礎的演進
2024 年有多個搜尋引擎為基礎的 RAG 框架釋出並取得比較大的關注,包括 QAnything、Ragflow、MaxKB 等近 20 個開源框架。這類都是比較經典的方法,以搜尋引擎的向量檢索和文字檢索為基礎為大語言模型提供外掛的文字知識庫,能夠在保證垂直領域資料隱私安全的前提下,將私域知識與大語言模型有效融合提升垂直領域的應用效率。RAG 開源專案通常集 Chunk 切分、向量化、儲存、檢索、生成等幾個階段於一體,其核心在於其中的不同策略適應和最佳化,如文件處理、檢索策略等。
以搜尋引擎為基礎的演進方案以文件檢索為開始,以大語言模型的生成為終。RAG 回答問題的準確率受限於召回的 Chunks 和 LLM 的生成能力,也受限於搜尋引擎向量相似度計算的不足,傳統搜尋引擎解決不了的問題,如難以感知文件間細粒度的實體知識關聯、無法對文件內知識的知識要素執行邏輯推理等,這類 RAG 方法依然解決不了。這也讓開發者陷入了 “一週出 demo,半年用不好” 的困境。為克服以搜尋引擎為基礎方法在向量計算和邏輯推理方面的不足,業界也湧現出了越來越多基於知識圖譜的方案。
以知識圖譜為基礎的演進
知識圖譜技術是 2012 年 Google 為改善搜尋引擎的質量和相關性而提出的,他能夠構建並理解實體及其之間的關係,能夠整合不同來源的文件實現跨文件的實體關聯,這使得知識圖譜可以對使用者查詢提供更加精確和語境化的回答,可以突破向量計算的瓶頸而執行多步推理、邏輯推理。儘管有這些優勢,知識圖譜因其較高的構建和維護成本高,過去這幾年也遭到了較多的詬病。
大模型技術的出現,為知識圖譜技術的發展提供了新的機遇視窗。如何充分利用大語言模型的能力來克服知識圖譜的不足,並充分發揮知識圖譜的優勢?2024 年,湧現出了多個不錯的開源專案並獲得了廣泛的關注。
以 GraphRAG 為代表增強文件間語義關聯
2024 年初有兩個非常有代表性的工作,微軟釋出的 GraphRAG 和俄亥俄州立大學釋出的 HippoRAG。兩者都引入了知識圖譜的方法透過開放資訊抽取 (OpenIE) 來構建跨文件的細粒度語義關聯以期緩解 RAG 在這方面的不足。
GraphRAG 藉助大模型和社群挖掘構建層次化社群摘要以支援能更全面的回答全域性性問題,比如 “文件中的娛樂明星都出席過哪些活動”,而 HippoRAG 則引入了 PPR 及 IRCoT 的方法來挖掘跨文件的事實關聯以回答多跳事實問答,比如 "斯坦福哪個教授是從事神經科學阿爾茲海默症研究的"。兩者的核心目標依然是更有效的召回與目標 Query 相關的 Chunks,以生成更高質量的摘要或事實問答。但由於這兩個方法的目標有所不同,導致它們的技術路線在 Chunks 構建、召回、答案生成及評價指標上有所差異。
GraphRAG 使用大型語言模型 (LLM)提取的知識圖譜。圖片來源於:
https://www.microsoft.com/en-us/research/blog/graphrag-new-tool-for-complex-data-discovery-now-on-github/
GraphRAG 類方法有效緩解了 RAG 跨文件語義關聯不足的問題,無論在摘要問答和多跳問答上都取得了較大的效果提升,證明了這類方法的有效性。
後續開源的 LightRAG、DB-GPT、lazyGraphRAG 是針對 GraphRAG 資源消耗大的方法改進,OpenSPG 開源的 KAG 較多的借鑑了 HippoRAG 的思想。GraphRAG 類方法因引入 OpenIE 抽取而引入了大量噪聲導致構建的知識圖譜並不能直接應用於推理,知識圖譜強事實性、準確推理等優勢並沒有得到有效發揮。
以 ToG 為代表的大模型增強傳統 KBQA
2024 年也有較多以傳統知識圖譜 KBQA 為基礎的方法,透過大模型重塑了問答階段的問題理解和答案生成過程,同時透過大模型 SFT 技術提升問題的邏輯拆解、三元組提取的準確性,具體到圖譜的推理和檢索過程與傳統的 KBQA 類方法基本一致,比較有代表性的工作包括 ChatKBQA、ToG 等。
這類方法是比較純正的知識圖譜技術路線,實現了結構化知識圖譜與大模型技術的結合。社群關注度較高的 ToG 也推出了 2.0 版本在處理複雜推理任務、增強深度推理能力以及提供可解釋和可追溯的推理路徑方面更加出色。KBQA 為基礎的方法依賴已構建完備的知識圖譜,知識圖譜長期被詬病的構建門檻高的問題依然沒有得到緩解。
以 KAG 為代表的知識推理和資訊檢索
2024 年 10 月螞蟻集團釋出的 OpenSPG/KAG 是知識圖譜類方法中比較值得關注的,它主張邏輯符號引導的推理和檢索以提升垂直領域知識問答的邏輯性、事實性。KAG 在框架設計中充分考慮了知識圖譜、向量檢索及大語言模型的能力優勢,傳統知識圖譜被廣為詬病的構建門檻高、知識稀疏性等問題在 KAG 框架中都得到了較多的詮釋。
KAG 框架是結合醫療、政務等垂直領域應用打磨而來,其中為降低領域知識圖譜的構建門檻,KAG 適配了開放資訊抽取以支援垂直領域的開箱即用和快速冷啟動,並透過自動知識對齊模組來緩解開放資訊抽取帶來的噪聲問題;為提升推理準確性並降低知識稀疏性帶來的影響,KAG 引入了分層知識推理與檢索框架,在結構化推理無果的情況下借鑑 QFS 的思想從 Chunks 中檢索與目標問題相關的答案。
KAG 框架上算是知識圖譜與大模型技術的集大成者,程式碼中大量使用的本體結構、邏輯規則等圖譜的技術元素。KAG 目前開放的是一個比較基礎的版本,一般使用者的上手成本還比較低,基本可以開箱即用。同時,結合垂直領域的推理要求還有較多工作需要持續最佳化,大量使用的圖譜技術也讓開發者的最佳化有一些學習門檻。
展望
隨著大模型訓練正規化從預訓練(Pre-training)階段向後訓練(Post-Training)階段的遷移,人們的關注焦點也逐漸從語言模型的生成能力越來越多轉向推理能力。這一轉變的本質是更加重視模型理解和處理複雜問題的能力。
以此為驅動,垂直領域私域知識庫的應用也會更關注解決複雜問題的能力,如指標解讀、研報生成、診療決策、表格計算、事實問答等,這些都是傳統 RAG 向量計算模型難以解決的。
隨著大語言模型理解能力的不斷增強,知識圖譜可以不斷克服並降低其構建門檻高、知識稀疏性等帶來的影響,其固有的強推理能力和高可解釋性的優勢將得到更充分的發揮。
可以預見,2025 年基於知識圖譜 + 大語言模型的垂域推理應用和開源專案將越來越多的湧現,為垂直領域的複雜問題問答推理提供新的解決方案。

作者簡介
梁磊
螞蟻集團知識引擎負責人,KAG 專案負責人,OpenKG TOC 專家。個人的主要技術方向為知識圖譜、圖學習及推理引擎、AI 引擎等,也從零到一基於螞蟻多樣化的業務場景構建了企業級知識圖譜平臺,平臺累計提報專利 140 餘項,軟體著作權 10 餘項。主導的專案先後獲得 BU 總裁特別獎、優秀科技成果、金融科技創新獎、金融科技發展獎等。
KAG 是一個知識增強生成的專業領域知識服務框架,KAG 依賴 OpenSPG 提供的引擎依賴適配、邏輯推理執行等能力:https://github.com/OpenSPG/KAG
閱讀完整報告https://talk.gitee.com/report/china-open-source-2024-annual-report.pdf

🔗《2024 中國開源開發者報告》正式釋出
分享在看點贊~Orz

相關文章