關鍵詞:生物醫學研究;可重複;Nature
摘要:巴西研究可重複性倡議是一個由50多個研究團隊參與的大規模專案,旨在透過複製實驗評估巴西生物醫學研究的可重複性。
該專案於2019年啟動,涉及213名科學家和56個實驗室,聚焦於三個常用方法:細胞代謝檢測、遺傳物質擴增技術和齧齒動物迷宮測試。
主要發現研究發現,只有21%的實驗在至少一半的評估標準下被認為是可重複的。
原論文的效應大小平均比複製實驗大60%,變異係數低60%,可能反映了選擇性報告或資料不一致性。這些結果與其他領域(如心理學和癌症研究)的大規模可重複性研究一致,顯示低可重複性是全球性問題。
結論:這表明生物醫學研究可能存在系統性問題,需透過公開資料、標準化協議和教育改革來改善。

近年來,科學界對發表研究的可重複性和可複製性問題日益關注。
2019年啟動的巴西可重複性倡議(Brazilian Reproducibility Initiative)是一個由50多個研究團隊參與的大規模專案,旨在透過系統性的實驗複製評估巴西生物醫學研究的可重複性。
該專案由巴西里約熱內盧聯邦大學(UFRJ)的研究人員協調,涉及213名科學家和56個實驗室,旨在為巴西科學界提供實證資料,併為全球科學改革提供參考。
該研究於2025年4月8日釋出在bioRxiv預印本伺服器上,尚未經過同行評審。
方法
巴西可重複性倡議的獨特之處在於,它聚焦於常見的研究方法而非單一研究領域。研究人員首先透過審查隨機樣本的生命科學文章,確定了巴西生物醫學研究中最常用的方法。最終選擇了三個常用方法:
-
細胞代謝檢測(MTT assay)
-
遺傳物質擴增技術(reverse transcription polymerase chain reaction, RT-PCR)
-
齧齒動物迷宮測試(elevated plus maze, EPM)
隨後,研究人員隨機選取了1998年至2017年間發表的使用上述方法的生物醫學論文,條件是至少半數作者具有巴西背景。
最初選擇了60篇論文進行復制嘗試,每個實驗由三個獨立實驗室重複。最終,完成了97次有效的複製嘗試,涵蓋47個實驗。
評估可重複性的標準包括五個預定義指標,例如是否至少有一半的複製嘗試獲得了與原論文相同方向的統計顯著結果(p < 0.05)。
該專案在COVID-19大流行期間展開,面臨諸多 logistical 挑戰,例如實驗室關閉和團隊協調困難。專案協調人Olavo Bohrer Amaral將其比喻為“試圖將數十個各有特色的車庫樂隊變成一個交響樂團”。
主要結果:
巴西可重複性倡議的關鍵發現如下:

具體來說,研究發現:
-
只有不到一半的實驗結果得到了驗證,具體為21%的實驗在至少一半的評估標準下被認為是可重複的。
-
原論文的效應大小平均比複製實驗中的大60%,表明發表的結果傾向於高估干預措施的效果。
-
原論文中的變異係數比複製實驗中的低60%,可能反映了選擇性報告或資料的不一致性,例如傾向於報告更“整潔”的結果。

這些結果與其他大型可重複性研究一致,例如:
-
2011年啟動的心理學領域Open Science Collaboration發現,只有36%至47%的實驗結果可以被成功複製。
-
癌症研究領域的Amgen研究發現,僅有不到一半(23篇高影響力論文中的<50%)的結果可以被複制。
巴西可重複性倡議的結果為生物醫學研究的可重複性提供了重要的實證資料。這些發現不僅對巴西科學界具有啟示意義,也為全球科學社群提供了關於如何改善研究質量和可信度的寶貴經驗。
研究人員和評論者指出,低可重複性可能源於多個因素:
-
實驗設計和方法描述不足:許多原論文缺乏詳細的方法描述,導致複製實驗難以精確重現。
-
實驗室間變異:生物醫學研究中,生物材料(如細胞或動物)的環境變化、試劑的批次差異等因素可能導致實驗結果的變異。例如,生物學家Marcelo Mori指出,活體生物(如齧齒動物和細胞培養)對溫度、飲食、微生物群或培養基成分的變化反應可能不同。
-
選擇性報告:原論文可能傾向於報告更具統計顯著性或更符合預期的結果,導致複製實驗的效應大小較小。專案協調人Olavo Bohrer Amaral指出,這可能反映了“發表或滅亡”(publish or perish)文化的壓力。
全球生物醫學研究情況
低可重複性問題並非巴西所獨有。其他領域的類似研究(如心理學和癌症研究)也發現了類似的問題,表明這是全球科學界共同面臨的挑戰。巴西可重複性倡議的獨特貢獻在於,它聚焦於一個特定國家的研究輸出,並透過多實驗室合作評估常見方法的可重複性,為區域性科學評估提供了新視角。
進一步建議
-
標準化協議:開發並推廣標準化的實驗協議,尤其是對常用方法(如MTT assay、RT-PCR等),以減少實驗室間的變異。
-
開放資料和協議:鼓勵研究者公開原始資料和詳細的實驗協議,以促進結果的驗證和複製。
-
教育與培訓:在生物醫學研究者的教育中增加關於可重複性和統計學嚴格性的內容,培養更高的研究標準。
-
加強統計分析的rigor:減少p-hacking和選擇性報告,例如透過預註冊研究設計和報告所有結果。
-
資助複製研究:增加對複製研究的資助,以激勵和支援此類努力的開展。
-
期刊政策改革:期刊應要求更詳細的方法描述,並積極考慮發表複製研究的結果,無論是成功還是失敗。
-
國際合作:促進國際間的可重複性倡議合作,分享最佳實踐和經驗教訓。例如,可以建立全球資料庫,收集不同國家可重複性研究的成果。
透過這些措施,科學界可以逐步解決可重複性問題,確保研究結果的可靠性和可信度,為更高質量的科學發現鋪平道路。
References:
【1】 https://www.nature.com/articles/d41586-025-01266-x
【2】 https://www.biorxiv.org/content/10.1101/2025.04.02.645026v2
作者:Dr. Mark。助理:ChatGPT
美國Healsan Consulting(恆祥諮詢),專長於Healsan醫學大資料分析(Healsan™)、及基於大資料的Hanson臨床科研培訓(HansonCR™)和醫學編輯服務(MedEditing™)。主要為醫生科學家、生物製藥公司和醫院科研處等提供分析和報告,成為諸多機構的“臨床科研外掛”。
網址:https://healsan.com/
點選👆;From Bench to Bedside, Healsan Paves the Path.
▼ 臨床科研技巧及文獻更新。
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
更多精彩,點選左下角“閱讀原文”。