NpjComput.Mater.:大原子模型為材料研發提速:零樣本也能精準?

海歸學者發起的公益學術平臺

分享資訊,整合資源


交流學術,偶爾風月

隨著人工智慧(AI)的迅猛發展,原子層面的建模、模擬與設計正經歷深遠的變革。基於機器學習的勢能函式模型如今在精度上已可媲美從頭算電子結構方法,並支援大規模、長時程模擬。然而,模型的生成與訓練過程仍然是實現大規模應用的主要瓶頸。如何用同一個模型來解決不同材料體系、不同任務需求,一直是個備受關注的難題。多年來,人們先後嘗試了多種方法,但仍缺少一種能夠同時在化學和材料等多學科體系保持高精度和高效率、又能相容不同計算任務的通用模型。
Fig. 1 | An overview of the proposed
LAM workflow.

本工作由來自北京科學智慧研究院、北京深勢科技等29個機構的42位合作者(通訊作者為Linfeng
Zhang和Han Wang)共同完成,提出了名為DPA-2的大原子模型新架構。與傳統需要“單打獨鬥”的單一任務訓練方式不同,DPA-2利用多工預訓練方法,一次性學習多種化學與材料體系(包括金屬合金、電池材料、藥物分子及鐵電材料等共18個數據集、73種元素)的特徵,這讓它能夠在面對“從未見過”的下游任務時給出更準確的預測。進一步而言,DPA-2大原子模型為後續的微調提供了極為便利的起點,從而在收集很少資料的情況下獲得令人滿意的結果,相比從頭開始訓練能將資料效率提升1-3個數量級,可大幅降低開發定製化模型的門檻,例如用於新型材料或新化合物的模擬與設計。
研究表明,採用多工預訓練方法的DPA-2模型,相較其他單一任務訓練的模型,在“零樣本”預測任務中精度提升至多可達50%,同時在多種下游任務中也表現優異。這說明,大原子模型與多工學習的結合,不僅進一步充實了分子模擬的理論與工具,也為高通量材料設計和前沿交叉研究帶來更多可能性,例如應對特殊結構的二維材料、複雜晶體或合金體系等。進一步,模型還可以使用蒸餾步驟將微調好的模型作為教師模型,生成高效精簡的學生模型,將模擬規模和體系均可以提升2-3個量級,以支援大規模分子動力學模擬。
展望未來,隨著更多多樣化資料不斷加入,DPA模型將為材料模擬、藥物設計乃至化工過程的預測與最佳化提供更廣闊的路徑。該文近期發表於npj ComputationaMaterials10: 293 (2024)英文標題與摘要如下,點選左下角“閱讀原文”可以自由獲取論文PDF。
DPA-2: a large atomic model as a multi-task learner
Duo Zhang, Xinzijian Liu, Linfeng Zhang, Han Wang et al.
The rapid advancements in artificial intelligence (AI) are catalyzing transformative changes in atomic modeling, simulation, and design. AI-driven potential energy models have demonstrated the capability to conduct large-scale, long-duration simulations with the accuracy of ab initio electronic structure methods. However, the model generation process remains a bottleneck for large-scale applications. We propose a shift towards a model-centric ecosystem, wherein a large atomic model (LAM), pre-trained across multiple disciplines, can be efficiently fine-tuned and distilled for various downstream tasks, thereby establishing a new framework for molecular modeling. In this study, we introduce the DPA-2 architecture as a prototype for LAMs. Pre-trained on a diverse array of chemical and materials systems using a multi-task approach, DPA-2 demonstrates superior generalization capabilities across multiple downstream tasks compared to the traditional single-task pre-training and fine-tuning methodologies. Our approach sets the stage for the development and broad application of LAMs in molecular and materials simulation research.
媒體轉載聯絡授權請看下方

相關文章