杜蘭大學 TonyHu 教授團隊發表Nat.Commun|突破性模型 GAM+ML 最佳化微生物耐藥性基因篩選

近日,杜蘭大學 Tony Hu 教授團隊Nature Communications發表了一項重要研究,介紹了一種組關聯模型Group Association ModelGAM的耐藥基因識別方法。該方法能夠精準識別與耐藥性相關的基因變異,並有效減少傳統全基因組關聯研究(GWAS)可能導致的假陽性交叉耐藥性假象,而無需依賴先驗知識。此外,該研究結合機器學習(ML)最佳化 GAM,提高了小型或不完整資料集的預測準確性。
1. 基於GAM的方法構建和臨床驗證。a對結核分枝桿菌分離株的藥物敏感性測試 (DST) 表型進行基因分型和最低抑菌濃度 (MIC) 培養分析。b透過基因型和表型資訊進行資料過濾。c將 結核分枝桿菌分離株序列和 DST 資料輸入 GAM 以識別與耐藥性相關的突變,然後使用統計指標評估 GAM 分類效能。d將機器學習應用於 GAM 分類為與耐藥性相關的 SNP,以預測耐藥性特徵。e進行多位點交叉驗證以表徵此 GAM + ML 預測方法的實用性。
GAM突破傳統耐藥性預測限
微生物耐藥性主要由突變、水平基因轉移以及抗生素濫用等因素驅動,導致常用抗生素的治療效果下降。現有耐藥性檢測方法存在諸多侷限性:培養法需在不同抗生素濃度下培養微生物,耗時長且操作繁瑣,尤其對於生長緩慢的細菌;分子檢測(PCR 和微陣列技術)雖然可以快速檢測已知耐藥基因,但難以發現新型或罕見耐藥突變;DNA 測序可檢測新突變,但依賴現有突變資料庫,存在假陽性和假陰性問題;GWAS雖然在識別與特定耐藥表型相關的突變方面取得一定成果,但在分析多重耐藥表型時存在侷限性。
GAM 採用系統化統計分析策略,從群體、基因和突變層次篩選並識別與耐藥性相關的基因變異。在群體水平,研究者根據菌株的耐藥特徵進行分類,將所有藥物敏感的菌株作為對照組,並排除耐藥特徵獨特但樣本量過少的菌株。隨後,使用 Fisher’s 精確檢驗比較各耐藥群體的 DNA 變異,並校正多重檢驗誤差,僅保留顯著富集的變異進行後續分析。
透過計算耐藥菌群與敏感菌群的變異檢測率差異,篩選出優勢比的變異,將目標變異數量從 55.8×10降至 31.0×10³,大幅提高了分析效率,精準鎖定與耐藥表型高度相關的關鍵突變。在基因水平,所有在特定耐藥菌株中顯著富集的 DNA 突變再次經過 Fisher’s 精確檢驗,以識別其與特定抗生素耐藥性的關聯,並歸類到相應基因,形成基因-耐藥突變關聯資料庫。在突變水平,進一步分析基因層面篩選出的變異,並結合 WHO 突變訊號評級系統進行分級評估,以識別罕見耐藥突變。這一系統化方法使 GAM 無需先驗知識即可精確識別耐藥基因變異,並有效減少 GWAS 可能出現的假陽性交叉耐藥性問題。
研究團隊應用 GAM 分析了 7,179 株結核分枝桿菌(Mtb)的基因序列與耐藥表型,成功識別出與抗結核藥物耐藥性相關的基因靶點。相比 WHO 基因突變目錄,GAM 顯示出更少的交叉耐藥性假象,無需依賴專家規則篩選,提高了預測的通用性和準確性。此外,GAM 在 3,942 株金黃色葡萄球菌(S. aureus)耐藥性分析中也表現出高預測能力,進一步證明了其適用於多種病原體的廣泛性。
研究團隊進一步結合機器學習(ML)最佳化 GAM,以提高預測準確度,尤其在小樣本或不完整資料集中。利用 427 株來自三家機構的 Mtb 臨床分離株進行驗證,結果顯示 GAM 提供的輸出變數比 WHO 方法更適用於 ML 模型,進一步提升了耐藥性預測精度。
臨床應用與未來展
GAM+ML 的結合不僅能減少假陽性交叉耐藥性的誤判,還能在無先驗知識的情況下準確預測耐藥性突變,為個體化抗生素治療提供更精準的指導,也為低成本基因檢測 POCT(即時檢測)手段的開發提供理論依據。這一技術有望廣泛應用於耐藥性監測、藥物研發和公共衛生防控,為抗擊耐藥性微生物感染提供更高效的解決方案
本文僅用於學術分享,轉載請註明出處。若有侵權,請聯絡微信:bioonSir 刪除或修改!


相關文章