

出生於湖北省孝感市漢川市楊林鎮的劉蘭,曾經歷過高考考入武漢大學的順遂,也經歷過耗時 7 年在中國科學院生物物理研究所完成碩博連讀的經歷,亦經歷過在中山大學醫學院從事博士後期間“僅以共同一作身份發表了一篇論文”,再到在美國國立衛生研究院從事博士後期間以第一作者身份發表一篇 Molecule Cell 和一篇 Nature。
最近,她的這篇 Nature 一作論文順利付梓。她告訴 DeepTech:“一路走來,我走了一枚‘學渣’平凡的成長之路。幸運的是,我在 2021 年和 2024 年各收穫了一個孩子,為這平凡之路又增添了許多酸甜苦辣和雞飛狗跳。目前,我還是博士後身份,還有一篇論文需要收尾。暫時打算 2026 年年底回國,目前還在找工作中。”

圖 | 劉蘭(來源:劉蘭)
在這篇 Nature 論文之中,劉蘭和所在團隊透過解析兩個高解析度複合物結構並結合功能實驗揭示了非同源末端連線如何修復 DNA 末端帶有缺口的 DNA 雙鏈斷裂。這個修復過程可以分為兩個步驟:第一步聚合酶補齊 DNA 缺口(gap-filling),第二步連線酶連線斷口(nick ligation)。
高解析度資料給研究團隊提供了很多重要資訊,其中最重要的兩點是:(1)聚合酶的招募機制,(2)連線酶和聚合酶的協同反應機制。以前,人們認為不同的酶採取競爭方式獨立結合 DNA 末端並對 DNA 進行相應的修復。然而,本次研究顯示連線酶始終結合兩條斷掉的 DNA 末端,其功能不僅作用於最終的連線階段,也在 DNA 末端加工階段輔助其它加工酶結合到 DNA 末端。因此,本次研究確認了連線酶在非同源末端連線途徑中具有多重核心功能,完善了這條通路的功能機制模型。

(來源:Nature)
非同源末端連線是 DNA 雙鏈斷裂的主要修復方式,其功能異常與許多疾病相關。比如,許多癌細胞中均發現非同源末端連線蛋白表達水平上調,抑制非同源末端連線可以增加癌細胞對化療的敏感性。目前,已有針對非同源末端連線抑制劑的藥物研發,大多針對蛋白激酶 DNA-PK 和連線酶 LIG4。然而,這類抑制劑的特異性是目前需要克服的主要難題,而針對蛋白相互作用的藥物設計不失為另一種可能的選擇。
研究團隊的高解析度結構模型清晰地顯示了非同源末端連線核心蛋白形成了一個修復平臺,招募不同的功能酶協同完成 DNA 修復;阻礙蛋白間關鍵的相互作用則可能導致這個修復平臺不能形成或運轉不暢。因此,本次研究結果為針對非同源末端連線抑制劑的設計提供了精確的靶標模型。
另一方面,一些病人由於攜帶非同源末端連線基因突變,導致遭受多種疾病的折磨,如嚴重的聯合免疫缺陷病、發育障礙、神經系統疾病、癌症等。根據研究團隊解析的非同源末端連線複合物結構模型,可以在分子層面分析部分突變體的發病機制,從而為精準醫療提供依據。

揭示聚合酶的新秘密
基因組 DNA 儲存著生命的遺傳密碼,包含了指導蛋白質和 RNA 生成的所有指令。因此,維持基因組 DNA 穩定性對個體生存和物種繁衍至關重要。然而,每時每刻 DNA 都受到各種外源和內源因素的干擾而產生損傷。比如,紫外線會造成皮膚細胞 DNA 損傷,X 射線等電離輻射也可以導致 DNA 鏈斷裂、鹼基改變等。所幸細胞擁有一系列複雜的 DNA 損傷修復通路,包括鹼基切除修復、核苷酸切除修復、錯配修復、DNA 雙鏈斷裂修復等,從而得以維持基因組的穩定性。
在眾多 DNA 損傷型別中,DNA 雙鏈斷裂對細胞的危害最大,若不能及時且正確的修復,則可能引起 DNA 大片段丟失、突變或重排,大大增加細胞死亡或癌變的風險。深入瞭解 DNA 損傷修復機制,不僅是對生命的探索,也是為相關疾病的治療甚至預防提供理論依據。
多年來,劉蘭的導師美國國立衛生研究院馬丁·蓋勒特(Martin Gellert)教授和楊薇教授深耕 DNA 損傷修復領域。其中,DNA 雙鏈斷裂(DSB,double-strand break)修復是研究團隊的一個重點研究方向。非同源末端連線(NHEJ,non-homologous end joining)則是最重要的 DNA 雙鏈斷裂修復途徑之一,負責修復大於 80% 的 DNA 雙鏈斷裂;另外,非同源末端連線還是抗體和 T 細胞受體基因形成過程中必不可少的一環。因此,非同源末端連線受損的病人往往有不同程度的免疫疾病。

(來源:Nature)
非同源末端連線途徑大致可分為 DNA 斷口識別、斷口加工和連線三個步驟,由 30 多種蛋白協同完成。這些蛋白根據功能的不同被分為核心蛋白、末端加工蛋白和輔助蛋白。其中核心蛋白的研究最為深入,它們可獨立修復含平末端或粘性末端的 DNA 雙鏈斷裂。然而,真實的 DNA 雙鏈斷裂損傷往往伴隨著 DNA 末端鹼基或結構破壞,需要加工酶(核酸酶、聚合酶、末端修正酶等)處理後才能被連線酶識別,而這部分的研究相對匱乏。因此,研究團隊以聚合酶為研究物件,旨在揭示聚合酶如何被招募參與非同源末端連線並與其它蛋白協同完成 DNA 雙鏈斷裂修復。

自行挑錯“震驚”審稿人
劉蘭表示:“這個課題從 2022 年開始,2024 年 7 月投稿,2025 年 4 月論文被 Nature 接受。”累計耗時大約三年左右。
在研究第一階段,他們重組表達並純化相關的非同源末端連線蛋白,並一共獲得 8 種非同源末端連線蛋白,有些使用簡單的原核體系表達,有些則需要使用哺乳細胞表達系統。由於研究團隊實驗室一直在做 DNA 損傷修復方面的工作,因此純化這些蛋白並沒有花費太多時間。
在研究的第二階段,他們篩選了參與 gap-filling 和 ligation 的蛋白成分。研究團隊用不同的蛋白組合做酶活實驗來觀察哪種組合能最高效的完成 DNA 修復,從而確定哪些蛋白能夠形成功能複合物。
在研究的第三階段,研究團隊針對實驗條件進行最佳化,例如緩衝液的離子濃度、pH 值、新增劑等,從而得到更高的酶活效率,因為更高的酶活預示著可能有更多的蛋白形成了功能複合物。
在研究的第四階段,他們根據酶活實驗確定的條件,用單顆粒冷凍電鏡技術捕捉複合物。這個複合物涉及 16 條蛋白鏈、大約 1MDa 分子量。其主體結構鬆散、各部分之間柔性很大。直接冷凍樣品並不能得到完整複合物,為此,研究團隊使用了交聯劑穩定複合物,並透過交聯劑濃度最佳化和凍樣條件最佳化,最終將解析度推至 3Å 左右,足夠他們搭建精準的結構模型。
在研究的第五階段,他們針對模型提供的結構資訊做了一些功能實驗,使得結構與功能相互支撐,從而使本次結論更加可信。
但是,劉蘭表示:“我覺得比較幸運的是我們在論文返修階段發現了一個致命疏漏,避免了論文發表後再更正或撤稿的尷尬。”
三位審稿人的第一輪意見特別正面,唯一的一個主要關切是研究團隊的生化實驗結果中 XRCC4 類因子(XLF,XRCC4 like factor)蛋白功能偏弱,與以前發表的論文結果不完全一致。返修時,研究團隊花了兩個月的時間反覆重複實驗或最佳化實驗條件,但始終只能重複之前的結果。
透過對各種因素逐一排查,最終發現他們使用的 XLF 蛋白 C 末端降解了 20 多個氨基酸導致 XLF 功能受損。這個蛋白表達時融合了麥芽糖結合蛋白(MBP,Maltose-Binding Protein)純化標籤,在純化過程中需使用 PreScission 蛋白酶將 MBP 標籤切除。讓人意外的是 XLF 序列中含有一個弱的 PreScission 蛋白酶識別位點,導致 XLF C 末端也被意外切除。由於這個截斷體與全長蛋白的分子量很接近,研究團隊並沒有透過 SDS-PAGE 膠或分子篩出峰位置發現其異常,這也導致了功能實驗結果與相關文獻的結果有點出入。
發現問題之後,他們優化了純化方法並得到了全長 XLF 蛋白。果不其然,全長 XLF 蛋白促進非同源末端連線效率的功能大大增強。於是,研究團隊又花費四個月時間,用全長蛋白將所有的結構和功能實驗全部重做。“所幸那個降解片段並沒有影響複合物的全域性構象,對論文結論沒有影響。”劉蘭表示。
由於蛋白純化的這點疏忽,導致一個“小修”的論文變成了重做。“返修後,審稿人也被我們的操作震驚了,並感嘆於如此之大的工作量。這個教訓讓我深刻體會到魔鬼確實藏在細節中,往後切不可麻痺大意。”劉蘭說。
最終,相關論文以《動態組裝與非同源末端連線協同反應》(Dynamic assemblies and coordinated reactions of non-homologous end joining)為題發在 Nature,劉蘭是第一作者,馬丁·蓋勒特(Martin Gellert)教授和楊薇教授擔任共同通訊作者。

圖 | 相關論文(來源:Nature)
如前所述,本次研究結果顯示非同源末端連線核心蛋白會形成一個修復平臺,招募不同的酶參與修復 DNA 損傷末端。目前,研究團隊研究了聚合酶的作用機制。基於此,該團隊計劃進一步完成其它末端修復酶的組裝和協同機制研究,以便全面揭示 NHEJ 這一重要複雜且精妙的分子過程。
參考資料:
1.Liu, L., Li, J., et al. Dynamic assemblies and coordinated reactions of non-homologous end joining. Nature (2025). https://doi.org/10.1038/s41586-025-09078-9
運營/排版:何晨龍



03/ 科學家用金屬有機框架打造微納機器人,開啟高效降解甘油三酯新應用,能適應多種生物環境
04/ 大模型失控前兆:16款大模型為自保竟洩露機密,Anthropic緊急報告AI自主性暗藏風險
05/ 微軟研發4D幾何編碼法,有望實現50個邏輯量子位元的建立和糾纏,讓編譯任何量子演算法成為可能