囊括1400+論文！大語言模型上下文工程全面綜述：框架、系統與挑戰

本工作由中科院計算技術研究所團隊主導完成，旨在為未來的上下文感知智慧體系統提供清晰的理論基礎與系統藍圖。

論文標題：

A Survey of Context Engineering for Large Language Models

論文全文：

https://arxiv.org/abs/2507.13334

配套資源庫：

https://github.com/Meirtz/Awesome-Context-Engineering

Hugging Face 頁面：

https://huggingface.co/papers/2507.13334

Motivation與背景

大型語言模型（LLMs）的效能從根本上取決於其在推理過程中獲得的上下文資訊。隨著 LLMs 從簡單的指令遵循系統發展為複雜應用的推理核心，如何設計和管理其資訊有效載荷已演變為一門正式的學科。

傳統的“提示工程”（Prompt Engineering）概念已不足以涵蓋現代AI系統所需的資訊設計、管理和最佳化的全部範圍。這些系統處理的不再是單一、靜態的文字字串，而是一個動態、結構化且多方面的資訊流。

上下文工程（Context Engineering）的出現，旨在超越簡單的提示設計，系統性地最佳化供給 LLMs 的資訊有效載荷。

然而，上下文工程領域的研究雖然發展迅速，卻呈現出高度專業化和碎片化的特點。現有研究大多孤立地探討特定技術，如檢索增強生成（RAG）、智慧體系統（Intelligent Agent Systems）或長上下文處理等，缺乏一個統一的框架來系統地組織這些多樣化的技術，闡明其內在聯絡。

為了應對這一挑戰，本篇綜述對超過 1400 篇研究論文進行了系統性分析，首次對 LLMs 的上下文工程進行了全面和系統的回顧，旨在為研究人員和工程師提供一個清晰的技術路線圖，促進對該領域的深入理解，催化技術創新。

論文內容詳解

本綜述的核心貢獻是提出了一個將上下文工程分解為基礎元件（Foundational Components）和系統實現（System Implementations）的分類框架。

2.1 上下文工程的定義與形式化

我們首先對上下文工程進行形式化定義。對於一個自迴歸的 LLM，其模型引數為 θ，在給定上下文 C 的條件下，生成輸出序列的過程可以表示為最大化條件機率：

傳統提示工程將上下文 C 視為一個單一的文字字串，即 C=prompt。上下文工程則將 C 重新概念化為一個由多個資訊元件動態構成的結構化集合。

這些元件由一系列函式進行獲取、過濾和格式化，並最終由一個高階的組裝函式 A 進行編排：

這些元件對應了本綜述的核心技術領域：

基於此，上下文工程的最佳化問題可以定義為：尋找一組最優的上下文生成函式集合 F（包括 A、檢索、選擇等函式），以最大化 LLM 輸出質量的期望值。給定任務分佈 T，其目標是：

其中，是一個具體的任務例項，是由函式集 F 為該任務生成的上下文，是理想的輸出。這個最佳化過程受到模型上下文長度限制等硬性約束。

2.2 上下文工程的基礎元件

基礎元件是上下文工程的基石，我們將其分為三個關鍵階段：

2.2.1 上下文檢索與生成（Context Retrieval and Generation）

該元件負責獲取相關的上下文資訊，包含三個主要機制：

提示工程與上下文生成：設計有效的指令和推理框架，如思維鏈（Chain-of-Thought, CoT）、思維樹（Tree-of-Thoughts, ToT）和思維圖（Graph-of-Thoughts, GoT）等，以引導模型的思考過程。
外部知識檢索：透過檢索增強生成（RAG）等技術，動態訪問外部資訊源，如資料庫、知識圖譜和文件集合，以克服模型引數化知識的侷限性。
動態上下文組裝：將獲取到的不同資訊元件（如指令、知識、工具）編排成一個連貫的、為特定任務最佳化的上下文。

2.2.2 上下文處理（Context Processing）

該元件負責轉換和最佳化獲取到的資訊，主要包括：

長上下文處理：解決 Transformer 架構中自注意力機制帶來的 O(n2) 複雜度問題，透過架構創新（如狀態空間模型 Mamba）、位置插值和最佳化技術（如 FlashAttention）來處理超長序列。
上下文自精煉與適應：使 LLMs 能夠透過迭代反饋迴圈（如 Self-Refine 框架）來改進輸出，或透過元學習（Meta-Learning）和記憶增強機制實現對新任務的快速適應。
多模態及結構化上下文：將文字以外的資料模式（如影像、音訊）和結構化資料（如知識圖譜、表格）整合到統一的上下文中，是當前面臨的核心挑戰之一。

2.2.3 上下文管理（Context Management）

該元件關注上下文資訊的有效組織、儲存和利用，包括：