
北京航空航天大學聯合華為 2012 實驗室釋出了一項名為 BIGCity 的時空大模型。提出了了一種統一軌跡和交通狀態預測任務的新正規化。
本文第一作者為北京航空航天大學計算機學院博士生於勰,本文的通訊作者為北京航空航天大學計算機學院教授王靜遠。
目前該研究已被 ICDE 2025 正式接收,相關程式碼與模型已經全部開源。

論文標題:
BIGCity: A Universal Spatiotemporal Model for Unified Trajectory and Traffic State Data Analysis
論文連結:
https://www.computer.org/csdl/proceedings-article/icde/2025/360300e455/26FZCDlNR9m
程式碼連結:
https://github.com/bigscity/BIGCity
接收會議:
ICDE 2025 (CCF A 類)
單位:
北京航空航天大學計算機學院,華為 2012 實驗室

研究背景
在智慧城市與智慧交通系統的研究中,構建統一的時空大模型面臨資料異質性與任務多樣性的雙重挑戰。
傳統時空分析正規化將軌跡資料(個體移動序列)與交通狀態資料(群體流動特徵)視為獨立研究物件:前者以地理單元序列(如道路段 ID 序列,GPS 點)表徵個體移動軌跡,後者以動態圖結構(路網節點速度矩陣)描述交通流宏觀狀態。這種割裂導致兩類核心問題:
1. 表示鴻溝問題:軌跡資料的離散序列表示(如 GPS 點序列)與交通狀態資料的連續圖表示(如路段速度場)存在本質語義差異,傳統模型難以構建統一特徵空間
2. 任務異構瓶頸:實際應用中常需同時處理分類(如軌跡下一點預測)、迴歸(如行程時間估計)、生成(如缺失軌跡補全)等多工,傳統模型需針對不同任務單獨設計網路結構。
不同的任務存在複雜時空依賴關係,包括路網拓撲的靜態約束(如道路連通性)、交通流的動態演化(如早高峰擁堵傳播)以及個體移動的行為模式(如通勤規律),現有模型難以同時處理多種異構的時空任務。
為了解決上述挑戰,北京航空航天大學與華為聯合提出的 BIGCity 模型(Bidirectional Interactive Generalized City Model)首次構建了面向多模態時空資料的統一分析框架,透過統一時空表示體系與任務導向提示機制實現了軌跡與交通狀態資料的聯合建模。

研究動機
本文的創新點在於使用一個統一模型同時處理“軌跡類任務”和“交通狀態類任務”。像導航應用這樣的實際場景通常同時依賴這兩類資料——使用者既需要交通狀態的預測,也需要最優路徑的推薦(即軌跡)。
從本質上來說,交通狀態是由個體軌跡匯聚而來的,因此將二者進行融合有助於提升模型效能。然而,這一點在以往的研究中常被忽視,而我們的工作正是填補了這一空白。

如圖所示,BIGCity 是一個多工多資料(MTMD)模型。交通狀態類任務包括一步預測(O-Step)、多步預測(M-Step)和交通狀態補全(TSI);軌跡類任務包括行程時間估計(TTE)、下一跳預測(NexH)、相似軌跡檢索(Simi)、軌跡分類(CLAS)以及軌跡重建(Reco)。

模型方法
BIGCity 主要包含以下三個核心模組:
1. 統一的時空資料表示方法(ST-Unit & ST tokenizer)
2. 面向任務的 Prompt,用於適配多樣任務(Task-oriented Prompt)
3. 統一的訓練策略(Unified Training Strategy)
3.1 統一的時空資料表示方法
我們提出了 STUnit 和 ST tokenizer 兩個核心元件。城市中的多源異構資料通常都基於道路網路,每個節點包含靜態道路資訊和動態交通狀態。
軌跡資料和交通狀態本質上都是從動態道路網路中取樣得到的序列,二者的主要差異在於取樣方式。因此,我們設計了 STUnit,將軌跡和交通狀態統一表示為序列形式。

基於 ST-Unit,我們進一步設計了 ST tokenizer 來統一表示道路網路。如下圖所示,ST tokenizer 包含靜態編碼器和動態編碼器,分別建模靜態和動態特徵。同時,融合編碼器用於整合兩者,生成動態的道路網路表示。

透過整合 STUnit 和 ST tokenizer,軌跡與交通狀態都可被統一為特徵序列,進而以序列建模的方式統一訓練。考慮到 GPT-2 在序列建模方面的強大能力,我們選擇其作為模型的主幹架構。
3.2 面向任務的 Prompt
由於不同任務可能共享相同的時空輸入,僅依賴資料難以判斷具體任務型別。為此,我們引入了面向任務的 Prompt,用作任務識別符號。在該機制下,不同的時空任務資料可統一整合為一個數據集,實現聯合訓練。
具體而言,我們首先將時空任務劃分為四類(如下表所示),其輸出形式可歸納為兩類:1. 靜態離散的道路段 ID 分類;2. 動態連續特徵的迴歸。

因此,我們定義了任務佔位符 [CLAS] 表示分類任務,[REG] 表示迴歸任務。該佔位符不僅標識任務型別,也標明每個任務的輸出形式與維度。此外,我們為每個任務設計了專屬的 Prompt 模板,用於明確任務型別。相關模板示例如圖所示。


3.3 模型訓練(第六節)
如下圖所示,BIGCity 採用兩階段訓練策略:
1. 掩碼重建訓練:在該階段,僅輸入 ST 資料與任務佔位符,訓練模型生成通用時空表示;
2. 面向任務的 Prompt 微調:引入任務 Prompt 後,對模型進行多工聯合微調,從而具備多工能力。


實驗驗證
多任一模:BIGCity 在三個不同的城市,4 類 8 種不同的任務上進行了廣泛的驗證。實驗結果表明,在 8 種不同的任務上,BIGCity 普遍超越了當前 18 種不同的 task-specific 模型並取得 SOTA 的效能。

跨城市泛化:將在 BJ 資料集訓練的 BIGCity 模型遷移到 XA 和 CD 資料集,僅微調 tokenizer 的最後 MLP 層。
結果顯示,BIGCity-BJ 與原始模型相比平均效能下降在 7% 以內,且在大多數情況下仍優於所有基線模型,證明了其出色的跨城市泛化能力。
實驗表明,BIGCity 可在資料豐富的大城市預訓練,再遷移到資料有限的小城市,為實際應用中的跨區域部署提供了可能。
可擴充套件性:隨著 BJ 資料集規模擴大,BIGCity 在軌跡分類、搜尋和恢復等任務上的效能持續提升,且在大規模推理場景中保持穩定,展現出對大規模資料的有效利用和魯棒性。

結論與展望
本文提出了 BIGCity 模型,整合了異構的時空資料與異構的時空任務,實現了對軌跡和交通狀態資料的多工多模態分析。
BIGCity 具有強大的多任一模能力,在 8 個任務上超越 18 個基線模型,展現了優異的效能和泛化能力。未來期望納入 POI、網格等更多元的時空要素,以進一步拓展模型的應用場景和分析能力。
指導教師:
王靜遠教授(https://www.bigscity.com/jingyuan-wang/)
課題組:
北京航空航天大學計算機學院 BIGSCITY實驗室(https://www.bigscity.com/)
實驗室長期招聘青年教師、博士後,招收博士研究生以及實習生。有意者請聯絡 [email protected]

論文引用地址:
@INPROCEEDINGS {bigcity,
author = { Yu, Xie and Wang, Jingyuan and Yang, Yifan and Huang, Qian and Qu, Ke },
booktitle = { 2025 IEEE 41st International Conference on Data Engineering (ICDE) },
title = {{ BIGCity: A Universal Spatiotemporal Model for Unified Trajectory and Traffic State Data Analysis }},
year = {2025},
volume = {},
ISSN = {2375-026X},
pages = {4455-4469},
abstract = {},
keywords = {spatiotemporal data;universal model;trajectory;traffic state},doi = {10.1109/ICDE65448.2025.00334},
url = {https://doi.ieeecomputersociety.org/10.1109/ICDE65448.2025.00334},
publisher = {IEEE Computer Society},
address = {Los Alamitos, CA, USA},
month =May}
更多閱讀

#投 稿 通 道#
讓你的文字被更多人看到
如何才能讓更多的優質內容以更短路徑到達讀者群體,縮短讀者尋找優質內容的成本呢?答案就是:你不認識的人。
總有一些你不認識的人,知道你想知道的東西。PaperWeekly 或許可以成為一座橋樑,促使不同背景、不同方向的學者和學術靈感相互碰撞,迸發出更多的可能性。
PaperWeekly 鼓勵高校實驗室或個人,在我們的平臺上分享各類優質內容,可以是最新論文解讀,也可以是學術熱點剖析、科研心得或競賽經驗講解等。我們的目的只有一個,讓知識真正流動起來。
📝 稿件基本要求:
• 文章確係個人原創作品,未曾在公開渠道發表,如為其他平臺已發表或待發表的文章,請明確標註
• 稿件建議以 markdown 格式撰寫,文中配圖以附件形式傳送,要求圖片清晰,無版權問題
• PaperWeekly 尊重原作者署名權,並將為每篇被採納的原創首發稿件,提供業內具有競爭力稿酬,具體依據文章閱讀量和文章質量階梯制結算
📬 投稿通道:
• 投稿郵箱:[email protected]
• 來稿請備註即時聯絡方式(微信),以便我們在稿件選用的第一時間聯絡作者
• 您也可以直接新增小編微信(pwbot02)快速投稿,備註:姓名-投稿

△長按新增PaperWeekly小編
🔍
現在,在「知乎」也能找到我們了
進入知乎首頁搜尋「PaperWeekly」
點選「關注」訂閱我們的專欄吧
·
