
(本文閱讀時間:8分鐘)

材料創新是推動重大技術突破的關鍵因素之一。20世紀80年代鋰鈷氧化物的發現為現在的鋰離子電池技術奠定了基礎。如今,鋰離子電池為現代手機和電動汽車提供動力,影響著數十億人的日常生活。材料創新同樣是設計更高效太陽能電池、用於電網級能源儲存的低成本電池,以及用於從大氣中回收二氧化碳吸附劑所必需的一環。
找到一種符合特定需求的新材料如同大海撈針。過去,這項任務需要透過昂貴且耗時的實驗試錯來完成。近年來,計算篩選大規模材料資料庫加快了這一過程,但仍需要篩選數百萬個候選材料才能找到少數合適的。

圖1:材料設計篩選方法和生成方法示意圖
在頂級科學雜誌《自然》(《Nature》)近期發表的論文中,微軟研究院科學智慧中心的研究員們提出了一個從不同角度解決材料發現問題的生成式 AI 工具 MatterGen。不同於篩選候選材料,MatterGen 直接根據應用需求的設計要求生成新的材料,可以生成具有所需化學、機械、電子或磁性屬性,以及滿足不同約束條件的材料。MatterGen 開啟了一種基於生成式 AI 輔助材料設計的新正規化,能夠高效探索材料,進而超越已知的材料範圍。
論文連結:
https://www.nature.com/articles/s41586-025-08628-5
GitHub 連結:
https://github.com/microsoft/mattergen

作為一個基於材料三維幾何結構的擴散模型,MatterGen 可以透過調整隨機結構中的元素、位置和週期性晶格來生成所需的材料結構,這類似於影像擴散模型根據文字提示修改噪聲影像畫素顏色來生成圖片。該擴散架構專為材料設計,旨在解決週期性和三維幾何等特殊性質問題。
MatterGen 的基礎模型在生成新穎、穩定且多樣化的材料方面已達到領先水平(如圖2所示)。該模型利用來自 Materials Project(MP)和 Alexandria(Alex)資料庫的608,000種穩定材料進行訓練。其效能的提升得益於架構的最佳化以及高質量、大規模的訓練資料。

圖2:MatterGen 與其他方法在生成穩定、新穎和獨特結構的材料方面的效能比較。每種方法的訓練資料集在括號中標出。紫色表示僅由於 MatterGen 架構帶來的效能提升,青色則表示由更大的資料集帶來的效能提升。
Materials Project
https://next-gen.materialsproject.org/
Alexandria 資料庫
https://alexandria.icams.rub.de/
MatterGen 還可以透過標註資料集進行微調,在給定任何所需條件的情況下生成新材料。圖3展示了在給定目標的化學成分和對稱性約束,以及電子、磁性和機械屬性限制的情況下,生成新材料的示例。

圖3:MatterGen 示意圖。MatterGen 可以根據不同設計要求,如特定的化學成分、晶體對稱性或材料屬性,對模型進行微調。

MatterGen 相對於篩選方法的主要優勢在於其能夠訪問未知材料的完整空間。如圖4所示,MatterGen 在生成難以被壓縮的具有較高體積模量(如大於400 GPa)的新候選材料方面表現優異。相比之下,篩選基準方法受限於已知材料而趨於飽和。

圖4:MatterGen(青色)與傳統篩選方法(黃色)在尋找滿足設計要求(如具有大於400 GPa的體積模量)的新穎、穩定和獨特結構方面的效能對比。

成分無序是一個常見現象,指的是不同的原子可以在合成材料中隨機交換它們的晶體學位置。近年來,社群持續探索在計算設計材料的背景下,什麼才算是新穎的材料,因為廣泛使用的演算法無法區分相似元素僅在排列上有所不同的兩種結構。

圖5:成分無序示意圖。左:沒有成分無序的完美晶體,具有重複的單位晶胞(黑色虛線)。右:具有成分無序的晶體,其中每個位置有50%的機率為黃色和青色原子。
透過引入一種考慮了成分無序的新的結構匹配演算法,研究員們為該問題提供了初步的解決方案。該演算法能夠評估兩個結構是否可以被識別為有序的近似同一基礎成分無序結構,為材料的新穎性和獨特性提供了新的定義。目前該方法已在計算評估指標中採用,並作為評估工具的一部分公開發布。
GitHub 連結:
https://github.com/microsoft/mattergen?tab=readme-ov-file#evaluation

除了大量的計算評估,MatterGen 的能力還透過實驗合成得到了驗證。微軟研究院科學智慧中心與中國科學院深圳先進技術研究院合作合成了一種新材料 TaCr2O6,其結構是透過 MatterGen 在給定200 GPa的體積模量條件下生成的。合成材料的結構與 MatterGen 提出的結構一致,但在 Ta 和 Cr 之間存在成分無序。
此外,透過實驗測得該材料的體積模量為169 GPa,相比設計規格中的200 GPa,誤差低於20%,從實驗角度看非常接近。如果類似的結果能夠推廣到其他領域,MatterGen 將對電池、燃料電池等材料的設計產生深遠影響。

圖6:提出的化合物 TaCr2O6 的實驗驗證

MatterGen 為 AI 加速材料設計提供了新的機會,同時與微軟研究院科學智慧中心此前提出的 AI 模擬器 MatterSim 相得益彰。MatterSim 遵循科學發現的第五正規化,顯著加速了材料屬性模擬的速度。而 MatterGen 則在屬性生成的基礎上加速了新材料候選的探索。兩者協同作用既可以加速材料模擬,又能夠加速新材料的探索,從而形成飛輪效應。
為了最大程度地推動材料設計的影響力,研究員們現已將 MatterGen 的原始碼以 MIT 許可的方式釋出,並公開了訓練和微調資料,供社群使用和進一步開發。
GitHub 連結:
https://github.com/microsoft/mattergen

利用生成式 AI 技術,MatterGen 開啟了材料設計的新篇章。它探索了比篩選方法更廣泛的材料空間,並透過指令高效推動了材料探索。類似於生成式 AI 對藥物發現的影響,MatterGen 將在電池、磁鐵、燃料電池等廣泛領域產生深遠影響。
微軟研究院科學智慧中心也將繼續與合作伙伴展開合作,進一步開發、驗證這項技術。“在約翰霍普金斯大學應用物理實驗室(Johns Hopkins University Applied Physics Laboratory,APL),我們致力於探索能夠推動發現新型的、任務驅動的材料潛力的工具。因此,我們對 MatterGen 在材料發現方面的影響尤為關注,” 負責多個材料發現專案的 APL 計算材料科學家 Christopher Stiles 表示。
你也許還想看:
