新模型sPGGM:單樣本水平,有效識別複雜疾病發展“臨界點”|NSR

海歸學者發起的公益學術平臺
分享資訊,整合資源
交流學術,偶爾風月

近日,《國家科學評論》(National Science Review, NSR)線上發表了華南理工大學的數學學院劉銳教授團隊與佛山大學鍾佳元博士的研究成果。
該研究基於最優傳輸理論和高斯圖模型,提出了樣本擾動高斯圖模型(sPGGM),透過分析參照分佈與擾動分佈之間的動態差異,能夠在單樣本/細胞水平上有效分析疾病進展識別前疾病(臨界)階段,有效克服了傳統方法在利用高維有限樣本或單細胞資料識別臨界轉變時面臨的挑戰。
複雜疾病的發展過程通常可劃分為三個階段:相對正常階段前疾病階段疾病階段(圖1)。
圖1 複雜疾病發展的三個階段
前疾病階段是疾病發生惡化的臨界狀態,一旦跨越該階段,患者往往會經歷災難性且不可逆的病情惡化,從而對生命和健康構成嚴重威脅。因此,理解疾病進展的動態變化,特別是揭示前疾病階段,對於早期干預和治療具有至關重要的意義。
然而,準確識別複雜疾病的前惡化階段或臨界點面臨很大挑戰,因為相對正常階段與前疾病階段之間基因表達模式及臨床表型的變化往往較為微小。此外,資料噪聲、患者異質性以及樣本量有限等因素,也影響了臨界轉變的可靠識別
該研究中,劉銳教授團隊提出了一種創新的計算框架:樣本擾動高斯圖模型(sPGGM)。該方法基於最優傳輸理論和高斯圖模型,透過分析參照分佈與擾動分佈之間的動態差異(圖2),能夠在單樣本或單細胞水平上有效識別疾病進展中的臨界點或前疾病階段及其相關訊號分子(圖3),有效克服了傳統統計方法在高維有限樣本或單細胞資料中識別臨界轉變時面臨的挑戰。

圖2參照分佈與擾動分佈之間的動態差異。參照分佈透過相對健康樣本擬合得到,擾動分佈由特定病例樣本與相對健康樣本組混合樣本擬合得到。
圖3 sPGGM:有效識別疾病進展臨界點。基於最優傳輸理論和高斯圖模型,sPGGM能夠在單樣本水平上量化參照分佈與擾動分佈之間的動態變化。
為了驗證sPGGM的魯棒性與有效性,劉銳教授團隊將其應用於模擬資料(圖4)以及結腸腺癌(COAD)、甲狀腺癌(THCA)、腎透明細胞癌(KIRC)、子宮內膜癌(UCEC)、腎乳頭狀細胞癌(KIRP)和肝細胞癌(LIHC)等多種真實癌症資料的探測(圖5)。
結果表明,sPGGM能夠有效處理現實的疾病資料,準確識別不同疾病型別中的前疾病階段,並挖掘相關的動態網路標誌物(訊號分子)。此外,與現有的單樣本檢測方法相比,sPGGM在捕捉複雜疾病的關鍵訊號方面表現出更優的效能。

圖4 基於模擬資料評估sPGGM效能。 (a) 模擬資料使用18節點調控網路進行產生。 (b) sPGGM值的急劇增加預警著即將發生的臨界轉變。 (c) sPGGM景觀圖表明,訊號分子或動態網路標誌物(DNBs)的特定區域性網路score在系統接近臨界點時表現出急劇增加。 (d)-(f) sPGGM比以往單樣本方法具有較強抗噪效能。

圖5 基於sPGGM識別癌症進展過程中的前疾病階段。sPGGM和基因表達在六種不同腫瘤型別的表現: (a) 結腸腺癌(COAD)、(b) 甲狀腺癌(THCA)、(c) 腎透明細胞癌(KIRC)、(d) 子宮內膜癌(UCEC)、(e) 腎乳頭狀細胞癌(KIRP)、(f) 肝細胞癌(LIHC)。sPGGM值的顯著增大預警疾病惡化臨界轉變到來。
sPGGM作為一種新穎的單樣本模型,不僅為複雜疾病的早期診斷提供了新的思路,也為個性化醫療和早期疾病干預與治療提供了量化分析的工具。
華南理工大學數學學院劉銳教授和陳培教授為該論文共同通訊作者,佛山大學數學學院鍾佳元博士與華南理工大學數學學院黎俊賢為論文共同第一作者。該工作得到了國家自然科學基金、廣東省基礎與應用基礎研究基金等專案的資助。
點選“閱讀原文”閱讀原文。
媒體轉載聯絡授權請看下方

相關文章