
(本文閱讀時間:10分鐘)
天文學起源於人類仰望星空時對未知的好奇心。作為歷史最悠久的學科之一,天文學曾多次引領人類文明的科學革命。在 AI for Science(科學智慧)發展如火如荼的當下,基於大語言模型(LLMs)的科學智慧體是否也能協助天文學家探索宇宙,發現未知?
天文學是一個相對“小眾”的學科,除去諾貝爾物理學獎帶來的高光時刻,天文學家大部分時間都隱匿於大眾的視野之外。如果用一句話來概括天文學家的核心任務,那就是為宇宙中的各種觀測現象——小到每一個氫原子,大到整個可觀測宇宙——尋找一個合理的“解釋”。
天文學與其他學科有兩大根本區別:
-
宇宙中天體的物理條件過於極端,導致天文學的研究物件無法在實驗室中開展控制變數實驗,因此其理論框架中的大部分內容都存在爭議,即便是一個小問題往往也存在幾種甚至數十種在一段時間內無法驗證的理論;
-
天文學研究的成果通常不具有直接的現實意義。與蛋白質合成和材料發現不同,天文學研究成果通常是作為一種可解釋的白盒模型來推動其他學科的發展,例如太陽的譜線觀測直接推動了量子力學的誕生,廣義相對論的首次驗證源自對水星進動的觀測等。
這兩個特點使得天文學研究對可解釋性的要求極為嚴格,這也限制了黑盒人工智慧模型在天文學核心問題中的廣泛應用。然而,大語言模型透過在大量文字中進行預訓練,不僅掌握了豐富的天文學基礎知識,還擁有強大的邏輯推理能力,使其能夠構建因果模型來解釋觀測現象。
在此背景下,微軟亞洲研究院與清華大學天文系以及俄亥俄州立大學(The Ohio State University)的研究員們聯合開發了大語言模型智慧體 Mephisto,並首次將其用於對由詹姆斯·韋布空間望遠鏡(James Webb Space Telescope, JWST)觀測到的高紅移星系的深入分析,為宇宙誕生之初的“小紅點(Little Red Dots)”提供了可能的解釋,開創了將大語言模型作為邏輯推斷引擎進行科學發現的新正規化。

Interpreting Multi-band Galaxy Observations with Large Language Model-Based Agents
論文連結:
https://arxiv.org/pdf/2409.14807
小貼士:高紅移星系是指那些距離地球非常遙遠的星系,它們發出的光在到達地球的過程中,由於宇宙的膨脹,波長被拉長,導致光譜向紅色端移動,這種現象稱為紅移。紅移的數值(z)表示星系遠離地球的速度與光速的比值,紅移值越高,星系離我們越遠,也越古老。

圖1:人類天文學家的工作模式:由空間望遠鏡對成千上萬的星系進行觀測,天文學家從中發現“有趣”的源並試圖使用一系列物理模型對其進行解釋。(影像來源:NASA, I. LABBE)

在傳統天文學研究中,分析單個星系的物理性質是每一個天文學研究生新生的必修課。研究人員需要對星系形成理論有深入的瞭解,並對大量觀測資料進行分析,才能建立足夠紮實的專業技能。即便對於那些已經擁有豐富專業知識和經驗的研究人員而言,仔細探究一個星系的性質、排除各種假設,也是一個耗時的“體力活”。
而大語言模型智慧體 Mephisto 則可以幫助天文學家分析那些經過百億年旅程才到達空間望遠鏡的遙遠星系的測光資料。Mephisto 能夠基於給定的測光資料提出相應的星系物理模型,並與一個名為 Code Investigating GALaxy Emission (CIGALE) 的星系光譜模擬程式互動,評估當前物理模型與實際觀測資料的差異,分析其中可能的儀器系統誤差或者物理模型的不適用性,同時透過不斷調整星系物理模型的假設與引數先驗,為觀測資料尋找若干種可能的解釋。
因擁有以自然語言形式儲存的知識庫和儲存模組(memory),這使得 Mephisto 能夠從之前的嘗試中進行學習,避免重複失敗的路徑。其知識庫包含了與專業相關的技能知識,並且可以在與人類天文學家的互動以及對實際觀測資料的互動中,利用強化學習提升自身能力。
Mephisto 提取的知識庫具有現實的物理意義,反映了各種物理模型在不同情況下的優勢和侷限性,為人類天文學家提供了新的研究思路,也為初學者提供了有益的參考。透過模仿科學家的思考方式,Mephisto 將提出假設與不斷最佳化的過程形式化為一個樹搜尋框架,保證了最終的科學結論來自於整個推理過程的深入分析。

圖2:Mephisto的知識庫與儲存模組

研究員們在多樣化的資料以及前沿科學問題上的測試證明了,Mephisto 可以在持續的搜尋中不斷提出更加符合觀測資料的物理模型,並在這一過程中利用改善機制(self-reflection),學習更多的星系物理知識,進而提出更精準的假設。
如圖3所示,透過提供星系在不同波段發出的光流量大小資料,Mephisto 從一個基礎模型出發,持續探索和改善,發現了與當前星系觀測資料更吻合的解釋。在這一探索過程中,Mephisto 不僅逐漸完善了當前觀測的可能的假設空間,還驗證了科學結論對模型選擇的魯棒性。天文學家可以根據這些報告制定更新的觀測計劃,修正理論模型,逐步拓展科學的邊界。

圖3:Mephisto 對 JWST LRD 的最新觀測資料 JADES ID 90354 的分析過程

圖4:Mephisto 所提出的物理假設隨著推理深度(inference depth)以及學習深度(run depth)的演化過程。圖中 Y 軸為模型和資料的擬合優度,可以發現隨著推理深度與學習深度的提高,Mephisto 可以逐漸提出更好的假設。
在處理前沿科學問題方面,例如 JWST 觀測到的小紅點——一類可能徹底顛覆天文學家對宇宙認知的天體時,Mephisto 也表現出了專業研究人員甚至更高的水平。“Mephisto 能夠全面探索所有關於‘小紅點’的潛在假設,幫助天文學家更深入地理解這些超出現有理論框架的天體的物理內涵,進而可能帶來全新的科學發現。”高紅移星系研究專家、清華大學天文系副系主任蔡崢教授評價道。
如圖5所示,在星系恆星質量、塵埃消光與是否存在超大質量黑洞的三維座標系下,Mephisto 充分遍歷了所有可能的物理假設,得出的結論與人類天文學家(圖中紅點所示)相似,甚至更加完備。這類星系在早期宇宙中大量存在,極大地挑戰了目前的宇宙學理論。Mephisto 作為人工智慧助手,能夠持續挖掘此類資料,幫助人類天文學家拓展宇宙認知的邊界。

圖5:Mephisto 在 JWST LRD 的最新觀測資料 JADES ID 79803(一個宇宙形成12.7億年時的早期星系)上的表現與人類天文學家相似,甚至更加完備。目前天文學界的兩種主流解釋為:一個充滿塵埃的恆星形成星系,或是一個擁有超大質量黑洞的缺乏塵埃的星系。

“傳統上,天文學家只能透過某些啟發式的標準快速篩選觀測資料,只有最有潛力的天體才會得到專家的深入分析,而大多數星系都未曾被詳細研究。大語言模型智慧體 Mephisto 的出現改變了這一局面,它讓我們在資料爆炸的今天也能夠對觀測到的數十億個星系進行深入分析,幫助研究那些行為與現有物理學理論不符的異常天體。這一技術正加速推動我們突破科學知識的邊界。”來自俄亥俄州立大學天文系的丁源森教授評論道。
相比傳統的人工智慧應用,Mephisto 革新了天文學家與人工智慧的互動方式。天文學家們現在可以透過自然語言直接與人工智慧進行交流,將他們的領域知識和需求直接反饋給人工智慧,無需進行反覆且成本高昂的訓練過程,人工智慧也能夠將發現以自然語言的形式反饋給天文學家。這種以自然語言表達的知識可以在不同的星系光譜模擬程式和大語言模型之間遷移,無需重複訓練。
Mephisto 的推理過程嚴格遵循目前的星系形成理論,實現了白盒的求解過程,這與天文學追求的可解釋性完美契合,意味著 Mephisto 可以無縫融入到當前的科學研究正規化中。更重要的是,Mephisto 具備自主學習和持續進化的能力,能夠在分析大量資料的過程中不斷學習,同時避免了人類科學共同體可能存在的偏見,從而提出尚未被充分考慮的假設,進一步拓寬人類科學家的認知邊界。
作為天文學家的人工智慧助手,Mephisto 能夠在超級計算機上夜以繼日、不知疲倦地挖掘那些尚未被充分研究的星系測光資料,並將有趣的發現反饋給人類專家。同時,天文學愛好者也可以藉助 Mephisto 更多地參與到天文學研究中。未來,將大語言模型作為邏輯推理引擎,實現科學分析的自動化,這一新正規化將深入天文學研究的各個領域,持續激發天文學領域的創新活力。
你也許還想看:
