NpjComput.Mater.:多模態資訊融合:讓高分子表示更全面

海歸學者發起的公益學術平臺
分享資訊,整合資源
交流學術,偶爾風月

高分子材料因其結構的可程式設計性與效能的可調控性,廣泛應用於航空航天、生物醫藥等高技術領域,是支撐現代工業社會的基石材料。然而,面對結構日益複雜的新型高分子體系,如何高效、準確地預測其宏觀物性,並據此反推理性設計策略,一直是材料科學中的核心挑戰。傳統實驗法週期長、代價高;而近年來興起的深度學習技術雖展示出巨大的潛力,但其預測效能在很大程度上仍受限於材料“表示方式”的單一與不完整。當前主流模型往往僅依賴如SMILES序列、二維圖或三維構象等單一的輸入模式,難以全面捕捉高分子多尺度、多源的資訊結構。
為突破這一瓶頸,中國科學院上海微系統與資訊科技研究所俞文傑團隊聯合日本理化學研究所趙啟斌教授,提出了一個創新的多模態、多域高分子表示與預測框架——Uni-Poly。該模型系統性融合了SMILES2D分子圖、3D幾何構型和分子指紋四種結構模態,更首次引入基於大型語言模型生成的專業化文字資訊作為“第五模態”,將領域知識以自然語言形式納入模型之中,顯著拓展了表示空間的深度與維度。
Overview of the Uni-Poly framework.
在包括玻璃化轉變溫度、熱分解溫度、熔點、材料密度與電導率等多項關鍵效能預測任務中,Uni-Poly均顯著優於現有單模態或傳統多模態方法。在難以預測的熔點指標中,R²值較最佳基準模型提升高達5.1%。此外,注意力機制的可解釋性分析顯示:不同模態在不同效能指標上展現出互補優勢,例如,文字資訊對於電子電阻率的預測至關重要,3D結構則對熔點尤為關鍵,而二維結構資訊(如SMILES和分子指紋)則構成整體預測的主幹骨架。文字中如“用於高溫塗層”或“柔性佳”此類語義提示,往往成為揭示關鍵熱效能的線索。
儘管Uni-Poly在效能預測上取得前所未有的突破,作者也指出了當前在預測誤差控制(如Tg預測的平均絕對誤差仍達22℃)及多尺度結構建模等方面仍有提升空間。下一步,研究團隊計劃引入更細粒度的聚合物結構資訊,並拓展至共聚物等更復雜體系,以進一步推動模型在實際工程設計中的應用價值。
這項研究不僅僅是對已有資料的“疊加”,更是一場關於材料表示正規化的深度重構。Uni-Poly以統一、多模態、高語義的表示方式“讀懂”高分子,為高分子材料的智慧預測、快速篩選與創新設計開闢了全新路徑。該文近期發表於 npj ComputationaMaterials 11:153(2025)英文標題與摘要如下,點選左下角“閱讀原文”可以自由獲取論文PDF。
Unified multimodal multidomain polymer representation for property prediction
Qi Huang, Yedi Li, Lei Zhu, Qibin Zhao & Wenjie Yu 
Polymer property prediction is a critical task in polymer science. Conventional approaches typically rely on a single data modality or a limited set of modalities, which constrains both predictive accuracy and practical applicability. In this paper, we present Uni-Poly, a novel framework that integrates diverse data modalities to achieve a comprehensive and unified representation of polymers. Uni-Poly encompasses all commonly used structural formats, including SMILES, 2D graphs, 3D geometries, and fingerprints. In addition, it incorporates domain-specific textual descriptions to enrich the representation. Experimental results demonstrate that Uni-Poly outperforms all single-modality and multi-modality baselines across various property prediction tasks. The integration of textual descriptions provides complementary information that structural representations alone cannot capture. These findings underscore the value of leveraging multimodal and domain-specific information to enhance polymer property prediction, thereby advancing high-throughput screening and the discovery of novel polymer materials.
媒體轉載聯絡授權請看下方

相關文章