RNA不只是DNA指導蛋白質合成的簡單中介,它在各種基礎生命活動的調控中所扮演的角色,經過數十年的研究,正以一系列出乎意料的方式出現在科學家的眼前。在《環球科學》2024年7月刊中,我們有幸邀請到西湖大學生命科學學院和醫學院的講席教授付向東老師翻譯封面文章《RNA:掌握生命後臺》。付老師主要研究RNA生物學與再生醫學,並且曾經在ENCODE計劃中參與RNA結合蛋白的表達和功能研究。於是,我們簡短地採訪了付老師,聊了聊RNA生物學領域的發展歷程,以及他對這篇文章的看法。由於採訪物件多年的工作習慣,對話中有多處中英夾雜。我們在音訊文字稿中使用了相應的中文翻譯,並將英文原文附在了括號內,以便大家能更好地理解。
黃雨佳(《環球科學》編輯):
付老師好!首先非常感謝您參與我們這一期非編碼RNA相關的文章的翻譯,也非常感謝您接受這次採訪。我們也知道您在RNA生物學領域其實已經深耕了非常多年,在這個領域也享有盛譽。但是能不能給一些可能不太熟悉您的讀者介紹一下您自己和您的研究工作的方向?
付向東(西湖大學教授):
這個話題挺長的,那我就簡單說說吧。實際上我是從博士(PhD)階段就開始接觸RNA,當時是做勞斯肉瘤病毒(Rous sarcoma virus)。這是一種RNA病毒,我那時候研究它的複製。因為它的基因組是RNA嘛,我們研究這個RNA病毒的裝配的機理。
實際上RNA一直挺火熱的,一直是發現的中心,每隔幾年就有一個突破。我做博士後時候的突破就是做到了體外剪接(in vitro splicing),這樣所有的RNA加工都可以在體外進行了。所以那個時候才開始。你看現在幾十年以後,所有的機制(machinery)不是都搞明白了?包括施一公的工作——剪接體的結構。當時是一無所知。
所以那個時候我就申請了湯姆·馬尼亞蒂斯(Tom Maniatis)的實驗室(lab),在美國哈佛大學(Harvard University)。他們實驗室(lab)也是一直很前沿,做RNA加工的相關研究。同時那個實驗室不光做剪接(splicing),也做轉錄(transcription),所以我覺得挺適合我的。實際上我就申請了那麼一個實驗室(lab)做博士後,然後他就錄取我了。
我在他的實驗室(lab)做了很多有意思的事情,包括鑑定了第一個剪接體的因子,後來導致了SR蛋白家族的發現,這個蛋白家族參與(involve)了組成型剪接(constitutive splicing)和選擇型剪接(regulatory splicing)的RNA加工。後來這個工作做完了以後,我就很順利地找到了工作。所以從1992年開始,我就加入了美國加利福尼亞大學聖迭戈分校(UC San Diego),繼續做RNA的研究,一直到今天,算起來現在也有40年的耕耘了。所以我對RNA的加工,不管是編碼(coding)RNA還是非編碼(noncoding)RNA,以及RNA功能有一系列的研究。
回想起來,大概我主要的工作關注(focus)在:第一階段的話主要是看剪接體、一些調控蛋白怎麼來調控RNA的加工;因為這個裡頭就有很多RNA結合蛋白,於是就擴充套件(expand)到RNA結合蛋白去了。後來我們就發現RNA結合蛋白有很多很多不同的功能,不光是在RNA的加工方面,實際上在轉錄裡也有很多作用,當然還有之後的翻譯什麼的。所以非編碼(noncoding)RNA也接觸了很多。
實際上,後來我們還發現,非編碼(noncoding)RNA和編碼(coding)RNA實際上也沒有那麼強的界定。編碼(coding)RNA在真正作為信使RNA(mRNA)之前,在它加工的時候或者轉錄(transcription)的時候,它本來就是作為非編碼RNA起作用(function as noncoding RNA)的,在細胞核裡面。因為在細胞核裡它也不編碼,所以那個時候它們自己要起很多的作用。當時我們就強調,實際上是在RNA加工成熟、真正行使信使RNA(mRNA)功能之前,實際上起作用(function)的就是非編碼(noncoding)RNA。
那當然不是說所有的都有功能了。這裡牽涉到轉錄加工和轉運的過程裡,參與了一些基因表達的反饋調控、細胞核的3D基因組的形成和很多很多各種別的功能,你都沒想到的,它們實際上在這個過程中都起到了作用。所以說,整個RNA這個過程,它是非編碼(noncoding)還是編碼(coding),那就取決於它是哪個時機。
那反過來,所謂的非編碼(noncoding)RNA,現在也發現有很多的RNA它也編碼(coding)。它只是在我們的認知範圍以外,編碼(coding)小的多肽(peptide),所以它也算編碼(coding)。所以只要到細胞質裡頭來了,說明還有很多是編碼(coding)的。但是大多數非編碼(noncoding)RNA實際上主要是滯留在細胞核裡。
黃雨佳:
雖然您說RNA生物學領域一直都很火,但是根據您參與翻譯的這篇文章來看,它可能認為是ENCODE這個專案出來之後,大家才對RNA的認知逐漸多起來,才變得火起來。
付向東:
它是從ENCODE這個角度,因為ENCODE是第一次想系統地揭示人類基因組裡面的功能。因為人類基因組計劃主要是測序嘛,雖然花了10年,花了很多的錢,但是這也帶來了一場革命。你拿到了這個基因組,也就是一個密碼,這裡頭意味著什麼,大家是不知道的,所以要有一個系統的工作(effort)。也是基於人類基因組計劃完成以後,後續的一個非常里程碑的工作了,所以我也有幸參與這個工作。
但是從RNA的角度來說,這個非編碼(noncoding)RNA、編碼(coding)RNA並不是說從ENCODE開始,老早就有認識了。然後你要從RNA本身的角度來說,它實際上是有一波(wave)一波(wave)的發現(discovery),一直在引領分子生物學的前沿。
從最開始的RNA催化(catalysis)開始,大概就是八幾年,托馬斯·切赫(Thomas Cech)和悉尼·奧爾特曼(Sidney Altman)他們發現RNA有酶活性,因此得了諾貝爾獎。所以那個時候就已經非常地火熱了。包括RNA的加工,RNA的加工跟II類核酶(class II ribozyme)實際上是用同一個機理。一個是要蛋白質來輔助,那就是必須要後面的剪接體;一個是根本不需要蛋白質,自己摺疊(fold),只要有足夠的鎂離子濃度它就可以發生。
所以因此而產生了“RNA世界”假說(RNA world hypothesis),就是說我們的整個的生命體系大概是從RNA開始的。就是因為RNA是核糖核酸,它不是脫氧核糖核酸,所以它在第二位的那個地方是個羥基,而不是個氫。所以羥基就多了很多的內容,因為它有親核能力來造成一些化學反應。所以最後就發現RNA既有儲存遺傳資訊的功能,也有表達遺傳資訊的功能。因為蛋白質沒有儲存遺傳資訊的功能,DNA沒有表達遺傳資訊的功能,所以說大家就認為,大概這個世界最開始是從RNA開始的。
黃雨佳:
對對對。但是就像您剛剛提到的,酶催化可能只是RNA功能的一個方面,但現在大家對RNA功能的認知大概有哪些方面呢?
付向東:
對,我接著剛才的說。就是說從RNA的催化,大家很快就過渡到RNA的加工。RNA的加工也是八十年代開始的,像菲利普·夏普(Phillip Sharp)還有理查德·羅伯茨(Richard Roberts)。實際上這裡頭還有一箇中國人的貢獻,實際上她貢獻很大的,叫周芷(Louise Chow),是一個臺灣省的女科學家,當時在美國冷泉港實驗室(Cold Spring Harbor Laboratory)。實際上,斷裂基因(split gene)這個RNA加工是她發現的。那個做得非常的好,然後因此也得了諾貝爾獎(注:菲利普·夏普和理查德·羅伯茨獲得了諾貝爾獎,周芷並未獲獎)。就是說信使RNA(mRNA)由不同的片段(fragment)來組成,最後拼接到一塊。
這個東西大概跟進化有很大的關係,就是說我們的基因組怎麼進化來的?所以說原來還有兩個理論叫作“先有內含子”(intron first)和“後有內含子”(intron last)。“先有內含子”(intron first)就是說,我們的基因組實際上是一個隨機複製(random duplication),很多的外顯子(exon)插進去,然後以某種方式(somehow)連起來了。這樣的話就可以讓一些基因如果產生突變(mutation)以後不會產生很多移碼突變。反過來,“後有內含子”(intron last)就是說,我們基因組大概是最小的單位,就像細菌(bacteria),它越小越好,利於它的生存和傳遞。然後這個內含子(intron,此處是口誤)不斷地加進去。所以這個內含子(intron)加進去以後把它分隔開了。
當然這是進化的理論,沒辦法證明(prove)。現在大家也不去爭了,但是大部分認為還是應該是先有內含子(intron first),就是它原來就有,然後基因複製(duplication)以後慢慢把基因組擴大。所以加工剪接這個部分本身,對基因組怎麼形成是有很多啟示(implication)的。現在研究的時候大家不去注意它了,因為這個是個理論問題,是吧?
到了後來,你也知道,就開始發展微RNA(miRNA)了。這個微RNA(miRNA)本來就是非編碼(noncoding)RNA嘛,所以在這個文章裡頭也寫了很多。當然微RNA(miRNA)以後就是很多長非編碼RNA(long noncoding RNA,lncRNA)。所以在這個時候,ENCODE也開始了,ENCODE無非就是更系統地來鑑定這些。
當然了,這些RNA相關研究的進步(evolution)一直到現在,包括CRISPR技術(technology),那也是RNA的東西。就是說,大概RNA領域每隔5年到10年就有一場革命。所以這就是為什麼RNA領域過去幾十年非常火熱。
但是實際上你要更進一步地說,就從DNA雙螺旋(double helix)開始,RNA就一直是一個資訊傳遞鏈的中心位置了。因為它只有變成了RNA,它才能傳遞遺傳資訊。DNA雙螺旋結構解析(double helix elucidated)了以後有很多的奇妙的猜想,我們做學生的時候就開始接觸這個,就是說為什麼遺傳密碼子都是3個。你想到沒有?不管是在地球的任何一個角落得到的生物,它的密碼子都是3個核苷酸(nucleotide)。你從來沒聽說過有2個或者有4個的吧。當然現在有的人就想打破這個特點。
黃雨佳:
非編碼RNA這個領域它確實非常火,但是就像這個文章裡說的,它也有很多的爭議。就是有些人覺得,這個東西可能沒有那麼重要。我不知道您作為業內人士怎麼看待這個問題。
付向東:
我也有自己的看法。實際上我覺得這個爭議就是科學進步的本身。很多東西剛開始出來都是有爭議的,而且越新穎的東西爭議越大。你說的這個問題就是說,這個RNA產生是沒問題的,但是有沒有功能?有的人說它是一個轉錄(transcription)的噪音(noise),有的人說只要存在就有可能是有功能的。從某種意義來說,你可以舉具體的例子,這兩個都有。這就是一個哲學問題了,存在的意義。是有意義才存在,或者是存在才有意義。有的人他基本上就是認為,只要能夠檢測(detect)到,一定有點意思的。反過來你想想,任何一個機器(machine),不管有多精確,都會造成誤差,會造成噪音(noise)。
所以說從噪音(noise)這個角度,我個人實際上是傾向於至少有一部分是噪音(noise)。因為這個機器不可能精確嘛。你看這個RNA加工,雖然我們知道內含子(intron)裡頭有很多調節性序列(regulatory sequence),但是加工完了以後,外顯子(exon)拼起來了,內含子(intron)基本上都是降解掉了。所以,那些降解掉的一些片段,你說它是有用還是沒用,對吧?就像你做一個機器,你總是有邊角廢料的嘛。你不能說是邊角廢料存在,這個就是有功能的,對不對?
再加上很多人也爭論(argue)說,一個細胞裡頭平均起來不到一個分子,所以你這個很難想象它有什麼具體的功能。當然反過來,這裡頭也爭論(argue)了,就是托馬斯·金格拉斯(Thomas Gingeras)。他就是說你這個是多個細胞的RNA序列(bulky sequence)得到的結果,誰知道哪一個細胞在某一個階段它表達很多,然後它有功能,這也是有可能的。但是都是假設可能存在(hypothetical)的功能。
生物體的奇妙就在於,它每一個機器都有誤差,加在一塊非常的精確。只有有誤差才有可能進化,因為誤差才是進化的源泉嘛。你看我們人類的進化,大部分的基因或者突變都是有壞的,但是也是好東西的來源,它就可以選擇(select)了嘛。你要是那麼精確,一成不變,那就是個機器。那生物的奇妙就在這,所以我覺得爭論每一個RNA是有意義還是沒有意義,我覺得這個沒必要這麼爭,是個無意義的爭論,我是這樣認為的(in my opinion)。只是隨著我們的認識不一樣,逐漸地深化,逐漸地認識到有一些新的東西是我們不知道的。
黃雨佳:
嗯。從一個學科角度來說,可能確實是這樣,但是如果從製藥的角度來說,這個RNA是不是有功能的,是不是還挺重要的?
付向東:
製藥那就是應用範疇的東西了。製藥離科學的發現那差得很遠的,所以這個應用早著呢。你不管是噪音(noise)也好,有功能的也好,慢慢逐漸意識到這些功能以後,會逐漸變成一些可以應用的東西。
黃雨佳:
那所以您對非編碼RNA相關的這些藥物開發領域有一些什麼樣的看法或者瞭解嗎?
付向東:
從我個人的角度來說,非編碼RNA用在藥物裡,無非就是用微RNA(miRNA),或者更多是小干擾RNA(siRNA),就是基因沉默的一個方式。
這就牽扯到藥物的幾大類了。其中一大類就是小分子藥物,主要是嵌合到蛋白質的某一些活性中心,來達到調節(modulate)蛋白質功能的一個方式作為藥物,對吧?但是真正基因組裡頭能成藥的蛋白質只有10%~15%,那剩下來的都是不能成藥的(non-druggable),即使它是有很重要的功能。所以這個時候你要用大分子藥物對這個基因沉默,或者是促進它高表達,那就可以作為藥物了。這一類叫做大分子藥物,就是包括信使RNA(mRNA)疫苗都屬於大分子藥物了。當然這個信使RNA(mRNA)疫苗是很大了,像那個小干擾RNA(siRNA),這就是可以來做藥物的。那現在美國食品和藥品管理局(FDA)也批准了一些,只是說現在還有很多挑戰,主要是遞送系統。
黃雨佳:
嗯,但是我看您自己的研究方向好像會更關注在RNA結合蛋白這方面。
付向東:
對,因為我覺得沒有 RNA 可以單獨起作用的。當然你可以推辭到“RNA世界”假說(RNA world hypothesis),在最原始的時候那可能是靠RNA來單獨起作用。在細胞裡頭RNA幾乎沒有單獨起作用這一說,總是跟蛋白質形成一個複合體來起作用。
我們不是在研究某一個東西,而是研究一類科學問題。所以這個科學問題就牽扯到了既有RNA也有RNA結合蛋白。因為現在看來。這個RNA結合蛋白實際上跟轉錄因子在基因組的數量是差不多的。所以為什麼要強調這一點?因為這個行使生命功能,不是說轉錄完了就不管它了,下面還有很多過程。蛋白質當然有千千萬萬,實際上RNA也有千千萬萬,有很多不同的功能。然後你在每一個RNA的功能裡頭研究,那就太迷人(fascinating)了。就是說,它把蛋白質和DNA做不到的事情全做了。
黃雨佳:
對,我看到您的一些研究確實還是非常有意思。就比如說同一個基因編碼的RNA是一種功能,但是它的基因和它的啟動子(promoter)可能會有其他的功能。
付向東:
對。它把你想不到的、蛋白質做不到的事情、DNA做不到事情全做了。它既可以在某一個時期作非編碼(noncoding)RNA,在某一個時期它也作一種感測器(sensor),在其他(other)時間它也作一個配體(ligand),然後甚至作激素(hormone)。
為了教課,我還專門總結了一下RNA的功能。後來我就發現,幾乎蛋白質能做到的事情它都能做,只是說它分工不一樣。蛋白質它因為有20個氨基酸,然後氨基酸的結構都不一樣,這樣摺疊起來形成比較嚴謹的結構域。RNA不就那麼幾個嘛?4個核苷酸,然後再加上RNA修飾(modification),所以它的結構域不是那麼精確。但是它有配對的原理,所以它就有各種各樣的你想不到的構象,而且這個構象是有蛋白質的時候是一樣,沒蛋白質的時候是另一樣,在不同的條件下它又可以不一樣。所以這裡頭的變化特別多,實際上是挺難做的,是一個挑戰。
黃雨佳:
所以這方面研究現在最大的難點主要是什麼呢?
付向東:
科學每一個話題(topic)都有很大的難點。當然RNA的難點就是說,一個是數量巨大。你看那個蛋白質,是吧?原來是一個基因一個蛋白質的學說嘛,後來蛋白質也有一些異形體(isoform),但是畢竟有限吶。這個RNA的異形體(isoform)就很多了。它整個一個大的RNA裡頭切成多少個小塊也算是異形體(isoform),或者是某一個功能形式差不多,但是它有共同的也有不同的區域或者模組。最大的問題是找到這些各種各樣的RNA的功能。它完全打破了一個基因一個產物的這個概念。
黃雨佳:
對,而且你還要從那一堆異形體(isoform)裡面找出來哪些是噪音(noise),哪些是真正需要的。
付向東:
對呀,很難搞啊。所以大家一個基因還是研究它其中的一個。對異形體(isoform)有深刻認識的,也就是幾十上百個基因。但是我們基因組裡頭幾萬個,然後還要加上那麼多非編碼(noncoding)RNA,很多地方不是我們知道的。所以說,這個東西存在,真正把它搞明白還是很有一段距離的。
黃雨佳:
嗯。那您覺得就像現在比如說有一些人工智慧(AI)相關的技術,比如說AlphaFold,它現在不是也能夠預測蛋白質跟核酸的相互作用嘛,它會不會在這方面有一些推動的作用呢?
付向東:
那當然的。原來因為很多東西都是靠有了結構以後才能開始來做一些,現在有了人工智慧(AI)以後,這個事情就變成正著反著都可以來做了,有了序列就可以預測結構。當然這個預測結構肯定要跟生物學功能的研究結合(couple)在一起,要不然你也不知道是真的是假的,或者你預測的是某一階段的。所以現在蛋白質結構是遠遠高於蛋白質複合物的結構,然後蛋白質複合物和蛋白質加起來遠遠高於RNA的複合物的結構,這所有的東西加起來遠遠高於RNA本身的結構。
所以RNA本身的結構也是個挑戰。體內你可以想一下,沒有遊離(free)的RNA的。我不覺得有任何的RNA是可以在細胞裡裸露地存在的(naked),因為細胞裡的密度(density)比外面大得多,有那麼多RNA結合蛋白,各種各樣的碰撞。你看現在慢慢進入到單細胞測序,你也可以到每一個RNA在每個細胞的表達之類的,但是每個RNA在細胞裡的構象呢,你怎麼測?那也是一個平均的狀態(average)。
黃雨佳:
那聽上去這樣用軟體預測的,其實……
付向東:
早著呢。這完全就是宣傳的誤導,以為有了AI以後就不需要我們幹了,該乾的事情都由機器幹了。這是不可能的事情。
黃雨佳:
是,還是有非常多的工作需要做。
付向東:
對,因為機器是根據人的總結,當然它可以很多地方超越(overpower)人大腦能夠實現的速度。你怎麼算也算不過計算器,但並不是說計算器比人腦更精確或者更有創造力。
黃雨佳:
嗯。那您可以順便再聊一下您對這篇文章的看法,或者有沒有什麼想說的嗎?
付向東:
這篇文章這個作者還是挺不簡單的。因為他是一個科普作者嘛,基本上把RNA的精華都放進去了。當然他不可能像一個嚴謹的科學的綜述那樣。因為綜述裡嚴格地要把科學的貢獻跟人連在一塊的,但是這裡無非就是挑幾個人、有代表性的人物,給人的印象是很多原始的發現都是他們發現的。實際上是有很多人貢獻了這些概念(concept),所以這個不能說是某一個人,他們只是一個代表。
但是非編碼(noncoding)RNA確實是非常迷人(fascinating),種類很多,功能所知甚少。所以很多的東西發表(publish)完了以後,回過頭來一看到底有多重要,有時候也說不清。
然後這裡有一個概念,就是說RNA是以叢集的形式,而不是以一個RNA的形式發揮功能。這個東西也說得對也說得不對。好比說這個微RNA(miRNA),它就是一個也可以有功能(work)的,而不是說非要叢集。但是反過來,像那種Piwi相互作用RNA(piRNA),因為它是從轉座子、從重複序列產生的,所以它差一個差兩個沒多少關係的。沒有人能夠敲除單個的Piwi相互作用RNA(piRNA)的,因為它那個都是重複序列的。你敲多少,你把基因組全敲了?基因組裡50%以上都是重複序列,對不對?好了,那個微RNA(miRNA)就可以敲了,它有的時候是單個的。那單個的也有功能,所以說並不是說一定要用群體,就是說“一定要成群體”這是他的想象。
黃雨佳:
嗯,可能是作者個人的觀點。
付向東:
個人的觀點,這個並不是大眾都這麼認為。當然微RNA(miRNA)以群體的形式來存在是可以的,但是並不是說微RNA(miRNA)因為以群體的形式存在,一個信使RNA(mRNA)有多個微RNA(miRNA)起作用,而忽略了它單個的微RNA(miRNA)也有功能。那個是肯定了的,就像那個裡頭引用的維克托·安布羅斯(Victor Ambros)那個,就是一個小的微RNA(miRNA)。那是第一次發現的,那個lin-4,那就是有很強的功能。
黃雨佳:
嗯,對。好,那我們這期節目就到這裡。非常感謝付老師接受我們的採訪。

