牛虻還是禿鷲?學術偵探又逼諾獎得主撤稿一篇!

海歸學者發起的公益學術平臺

分享資訊,整合資源


交流學術,偶爾風月

2月11日,諾獎得主托馬斯·聚德霍夫(Thomas Südhof)再度撤回一篇論文,理由是“影像有無法解釋的畸變”。該論文題為“Conditional Deletion of All Neurexins Defines Diversity of Essential Synaptic Organizer Functions for Neurexins”,於2017年5月發表在Neuron,撤稿前已被引用 145 次。
這是聚德霍夫撤下的第二篇論文。自2023年以來,他與學術偵探持續交鋒,雙方唇槍舌戰,互不相讓。學術偵探雖然迫使聚德霍夫撤下兩篇文章,但仍未找到證據坐實聚德霍夫學術造假;聚德霍夫方面則對學術偵探們吹毛求疵、背離同行評議理念的“圍獵行動”提出了系統批評。筆者以為,這一系列事件對於人們理解網際網路學術打假這一現象,或許有著啟示意義。
圖源:Nobel Pnobelprize.org
2013年,聚德霍夫因關於囊泡運輸的研究與James E. Rothman和Randy W. Schekman共同獲得了諾貝爾生理學獎。這位時年58歲的德裔美籍生物化學家,終於贏得了科學界的最高獎章。然而自2022年起,本已聲望卓著的聚德霍夫卻突然深陷學術不端的醜聞之中。
率先發難的是微生物學家、著名學術偵探伊麗莎白·比克(Elisabeth Bik),她一口氣在PubPeer上標記了聚德霍夫名下的三十多篇論文,指其涉嫌學術不端。其他學術偵探緊隨其後,一篇篇地檢視聚德霍夫文章中的問題。聚德霍夫感覺自己猶如身處放大鏡之下,他抱怨道:“是的,我們正在被圍獵。(Yup we are being hounded)”
Elisabeth Bik
圖源:Gerard Harbers
學術偵探整理出了不少論文中的圖片、資料問題。聚德霍夫也針對這些問題展開了回應。事實上,他在實驗室主頁上花了大量篇幅專門回應PubPeer指出的一些問題,所花精力不可謂不多。但總的來說,聚德霍夫從未真正承認自己存在任何學術造假行為,他稱這些圖片資料問題都是一些無意為之的小錯誤,既不關涉論文核心內容,也不影響論文主要結論的成立。
隨著雙方爭論的持續發酵,一些期刊也開始對偵探們提出的問題進行核查,不少論文的圖片資料問題在聚德霍夫方面的配合下得到了更正。但這些調整都還相對輕微,雙方交鋒的主戰場是聚德霍夫的兩次撤稿事件。
第一次撤稿:詭異的資料貼上錯誤
2023年3月,聚德霍夫在PNAS上發表了一篇新論文,該研究揭示了一種名為Neurexin-2的蛋白質在突觸形成中的作用。聚德霍夫的夫人陳路是來自中國的神經生物學家,她領導的團隊也參與了這項研究。可是,文章上線第一天,PubPeer上就有人質疑該論文的資料存在異常重複。PubPeer使用者Eirenis aurolineatus和Hydraena andreini等人比對了資料重複的現象,如下圖所示:
圖源:PubPeer
圖5C表格中的數字代表放電頻率,圖6F中的資料則代表峰電位幅度比率(配對脈衝比率),而圖2B顯示的是染色強度。如圖所示,資料重複的現象相當顯著。圖5C中重複的資料約佔一半。
面對質疑,論文第一作者Pei-Yi Lin第二天就在PubPeer上作出了回應。她承認資料存在一些問題,並解釋道:“我們上傳的不是原始資料的最新版本,而只是一個初步資料集。對於這個錯誤我深感抱歉。” 她在回應下方一併附上了“原始資料的最新版本”的圖片,意圖以這一資料版本替換掉已發表論文中的資料。然而眼尖的學術偵探們又發現,這些所謂的原始資料也不正常。
擅長運用統計學的學術偵探Nick Brown將已發表論文中的資料和Pei-Yi Lin回應時附上的“原始資料的最新版本”進行比對,認為這個“原始資料的最新版本”存在難以解釋的資料巧合,換言之,這個所謂的“原始資料的最新版本”是人為捏造的。
圖源:PubPeer
以圖6F的資料為例,上圖是Nick Brown製作的對比圖。左邊是已發表論文中的資料,中間是Pei-Yi Lin附上的“原始資料的最新版本”,右邊是兩列資料的集中對比。獨立科學記者、學術偵探Leonid Schneider表示,兩組資料的差異非常小,他們的資料平均值在小數點後15位之前都是完全一致的:0.835768218260869。Schneider稱他嘗試計算過這種巧合發生的機率,僅為千萬分之一。Nick Brown更是敏銳地指出,“許多修正值僅是在原始值基礎上簡單增加或減少0.1或0.3。這種極其極端的巧合明確指向了資料捏造的可能性。”
學術偵探們廣泛應用統計學計算對Pei-Yi Lin發表的“原始資料的最新版本”百般審查,發現了諸多資料上的“極端巧合”,並據此質疑實驗人員捏造資料。Schneider稱,恰恰是Pei-Yi Lin在回應中更新的這一“原始資料的最新版本”讓他們確認,論文的資料問題不是“無心的複製貼上錯誤”,而是“故意的資料造假”。
聚德霍夫就此回應稱,Pei-Yi Lin更新替換的這一“原始資料的最新版本”,也不代表論文真正的原始資料。他說:“論文主要作者 Pei-Yi Lin 博士提供的‘原始資料的最新版本’並不正確。我們無法找到這些替換資料的來源。並且,在Lin博士釋出這些資料之前,也沒有邀請實驗室中的其他人進行共同評估。”
他表示論文一作Pei-Yi Lin釋出的這組替換資料,是Lin的個人行為,不代表實驗室的立場。他說:“PubPeer並非我們實驗室指定的官方同行評審機構或出版物。如果實驗室成員以個人身份在PubPeer上發表內容,這屬於憲法第一修正案賦予其的言論自由權利。但此類帖子並不代表實驗室的官方立場。我在評論中僅明確指出,這些引起廣泛討論的替換資料並非來自我們的實驗室。”
學術偵探們認為聚德霍夫這種回應是在撇清責任,更是在迴避質疑。隨著雙方唇槍舌劍的持續發酵。2023年10月17日,也即論文發表7個月後,PNAS方面釋出編輯通知,對論文資料問題表達關注。2024年3月5日,聚德霍夫終於向PNAS要求撤下了這篇文章。
聚德霍夫等人在撤稿宣告中表示,“透過對論文某些原始資料的重新分析表明,儘管對原始資料的分析支援論文的結論,但這些原始資料與已發表的資料來源檔案之間存在無法解決的差異,無法透過簡單的勘誤來糾正。此外,資料來源檔案包含複製貼上錯誤,因此撤回該論文。”
圍繞這篇論文的交鋒,致使聚德霍夫方面與學術偵探的矛盾進一步激化。他在其他地方回應稱,自己是被學術偵探們“圍獵”了。他堅稱,PNAS論文的重複資料一些是複製貼上的無心之失,一些則是離散資料中的正常重複,而“學術獵手們”把這些無心之失放大為資料捏造的指控。他說:“當然,這些複製貼上錯誤不應該發生。……但我們現在不得不面對大量毫無根據的惡意造假指控,這確實令人沮喪。” 
其夫人陳路也回應道:“我們是否捏造資料篡改結果?絕無此事。我在PubPeer回應中已明確表態,在此重申:我以完全的信心與確定性,信任團隊同事的科學操守。此立場過去、現在、未來永不改變。” 她指出,對這些無心之失窮追猛打,只會讓青年科學家舉步維艱,扼殺科研的創造力。陳路向學術偵探們質問道:“若無心之失可被編織成連環指控以否定整個實驗室的學術價值,若對錯誤的恐懼擔憂足以扼殺創新探索的勇氣,您認為科學將走向何方?我們的年輕學者又將作出怎樣的職業選擇?”
第二次撤稿:無法解釋的圖片異常
隨著PNAS論文的撤下,雙方爭論的主戰場逐漸轉移到另一篇論文。也即2025年2月11日遭到撤稿的論文:“
Conditional Deletion of All Neurexins Defines Diversity of Essential Synaptic Organizer Functions for Neurexins”。該論文於2017年發表於Neuron。
圖源:CellPress
但這篇論文的問題卻是論文作者自己首先報告的。2024年4月,該論文第一作者Lulu Y. Chen(並非陳路)在PubPeer發帖稱:“在分析本人已發表論文時,我發現我無意中將論文圖2D中的某個部分重複使用於圖S3A。該錯誤源於將舊稿中的圖表整合至終稿時的複製貼上操作失誤。我謹代表團隊為此致歉——此類疏忽本不應發生。現主動公開此發現,待定位原始影像後將立即釋出勘誤宣告。”
但是Chen的報告並沒有附上圖片,而只有上面這段文字說明。PubPeer使用者Aneurus Inconstans隨即扒出論文圖片指出,這一影像錯誤可能並非簡單的複製貼上問題。因為圖S3A中複製自圖2D的部分,“其底部的 Native-GFP 和 vGluT2 訊號強度方面似乎發生了變化”。學術偵探推測,這應該是圖片在複製的同時經過了特別的影像處理,因此只能是刻意為之。
圖源:PubPeer
同樣以學術偵探身份活躍的神經科學家Matthew Schrag則表示,應當慎重質疑這些重複片段,因為有時這種影像重複的成因可能是良性的。並且就Chen報告的這項重複而言,其重複片段僅位於影像邊角處,並不影響圖片最核心最重要的部分。

Chen自己也回應道,“刻意複製”的指控荒謬可笑。她稱完全沒有動機去做這樣的修改。她在PubPeer回覆到:“我為什麼要對我的論文進行這種既不能改善影像質量又會損害其外觀的操作?這樣做的可能意圖是什麼?……但我們仍然相信,據我們所知,這些錯誤是這篇論文中唯一的錯誤。”

不過,Chen的回應很快被推翻了。2024 年 7 月,伊麗莎白·比克在這篇論文中發現了更多影像異常之處。比如該論文的圖S4B:
圖源:PubPeer
比克指出,有些重複部分是旋轉後拼貼的;有些旋轉部分則在不同的訊號通道下有差異,這說明重複不能是期刊編輯的失誤,複製行為發生在圖片製作的更早環節,接觸到這些環節的只能是研究人員自己。類似的重複問題還有不少,由比克及Maarten、Aneurus 和 Cheshire等學術偵探陸續指出。
2024年8月,聚德霍夫宣佈計劃撤回該論文,因為論文的圖片存在“無法解釋的異常”。值得注意的是,聚德霍夫在此次宣告中只感謝了Matthew Schrag博士,雖然大部分圖片重複的證據都由其他學術偵探提出。而Schrag這次恰恰對該論文的圖片重複質疑持審慎態度。
2025年2月11日,經歷了長達半年的撤稿談判之後,這篇論文被撤下。撤稿宣告稱:“我們作為本論文的作者,決定撤回該論文,因為我們發現圖1D和圖S4B中的影像存在無法解釋的異常,且這些圖的原始資料缺失。論文其他部分的原始資料仍可獲取,重新分析後確認了論文的結論。我們要感謝M. Schrag提請我們注意這些影像異常問題。” 
學術偵探Schneider稱聚德霍夫這是轉移了真正提出重複證據的學術偵探們的功勞。比克則在PubPeer留言回覆稱:“值得注意的是作者的措辭。‘我們發現’和‘無法解釋’似乎沒有反映出本帖討論的事實情況。同樣值得注意的是,只有Schrag博士因提請作者注意這一點而受到感謝。”
學術偵探:牛虻還是禿鷲?
Schneider成立了網站For better science(聚德霍夫聲稱該網站發表了大量文章對他進行人身攻擊),專門發表揭露學術不端的文章。在Schneider等學術偵探看來,他們當然是在扮演著牛虻一樣的角色,叮咬著學術出版這頭老馬使其前進。而在聚德霍夫等人看來,這些學術偵探(他似乎更樂意稱其為“學術獵手”)應當更類似於禿鷲,他們襲擊青年科學家,並且把那些十幾年前的老論文挖掘出來,貪婪地檢視。
Schneider主持的網站上詳細梳理了對聚德霍夫的質疑意見,有的文章言辭非常激烈
圖源:forbetterscience.com
聚德霍夫對於學術偵探們的憤怒自不待言。他認為學術偵探們正在為了牟利而刻意放大科學家們的錯誤。他在其實驗室官網寫道,PubPeer上以調查科學家錯誤來獲取收入的專業“科學誠信調查員”成為了主流。他稱學術偵探們正在用一種陰謀論式的方法放大科學家的微小錯誤。他說:“這些批評越來越多地暗示,微小錯誤並非是無心之失,而是更大問題的冰山一角。”
聚德霍夫在其網站上列出了攻擊他研究的主要的四位學術偵探。分別是伊麗莎白·比克、Maarten van Kampen (使用者名稱Orchestus quercus)、Patrick Kevin(使用者名稱 Actinopolyspora biskrensis)和 Kaveh Bazargan (使用者名稱 Illex illecebrosus)、Leonid Schneider。
他對這幾個學術偵探逐一介紹、分析,試圖說明這些學術偵探有哪些不公正的攻擊行為,及其可能存有的利益干係。比如,聚德霍夫稱比克專門從事影像複製的偵察,“但似乎沒有接受過計算機影像分析方面的正式培訓”,而且“可能會為大學、期刊和其他客戶提供有償服務”。
聚德霍夫專門統計了PubPeer評論他文章的情況,意圖證明該網站及某些學術偵探對他的攻擊性評論是有組織性的
圖源:med.stanford.edu
Schneider表示聚德霍夫是在扮演受害者同時抹黑學術偵探。他尖刻地譏諷道:“聚德霍夫是一個老年德裔白人男性異性戀千萬富翁,同時還是諾貝爾獎獲得者和斯坦福大學教授”,他當然符合受迫害群體的一切特徵。
顯然,雙方的攻訐已經逐漸脫離了學術批評範圍。但聚德霍夫在反駁質疑時,曾表達了一些關於學術評價的思考,尤其是關於學術偵探這一現象的批評。作為一個有著豐富科研工作經驗的科學家,聚德霍夫提出的這些意見有著相當的參考價值,或者,至少有值得回應的必要。
他稱,學術偵探發現的許多錯誤都是無意的錯誤,不會對科研結論產生任何影響。但這些錯誤在 PubPeer、X、部落格等社交媒體上的廣泛傳播,卻會給科研人員帶來巨大傷害,也會誘導公眾對研究本身產生不公正的誤解。尤其是年輕科學家,他們容易因為對小錯誤的指控而產生的撤稿,付出巨大的職業代價。聚德霍夫表示,在他自己的實驗室裡,這樣的指控已經將多名青年科學家趕出了實驗科學領域。他還特別強調,這些被迫離開的科學家多數是女性。
聚德霍夫說:“作為科學家,我們會犯錯,也應當正面承認錯誤。但我們也須自問,花費大量資源去糾正幾十年前犯下的小錯誤,這是否合理?尤其是,如果沒有人工智慧軟體,這些小錯誤可能根本不會被人注意到。” 
他進一步指出,社交媒體上一些本來對科研不感興趣的人,卻聲稱科學應當有“純粹的正確”,並且打著這樣的旗號去對研究人員吹毛求疵。他舉例說道,“如果一篇論文中有問題的資料只佔整個專案相當有限的一小部分,那麼打著‘科研應純粹’的名義撤回整篇論文又是否合理?我們是否應該有一個更合適的機制來處理類似的案例?”
另一方面,聚德霍夫也指出學術偵探這一職業背離了完全的客觀公正,因為該職業帶來的利益驅使他們去放大科學家們犯下的錯誤。他稱:許多評論員因他們的學術偵探工作而四處進行收費演講,還收穫各種“誠信獎金”。然而,科學家卻要因為他們沒有科學專業知識證據的指控,而焦頭爛額的回應。科學家們也不得不回應,因為期刊經常接受這些指控而不審查指控是否合理。於是科學家們必須在論文發表幾十年後,還要試圖去自證清白。
同行與外行,先審與後評
筆者認為,其實我們可以換個視角看待網際網路學術打假模式(學術偵探、以PubPeer為代表的學術打假網站、高度依賴社交媒體的傳播方式),這種模式其實代表了一種學術評價制度的新探索。
目前,學術出版最主要的“守門人”是同行評議制度。然而近年來同行評議制度的侷限性越來越明顯。首先,由於論文數量井噴,學科交叉現象越來越普遍,找尋到足夠數量且符合領域條件的評議人越來越困難;其次,為了保證公正,同行評議主要是單盲或雙盲的形式開展,因此評審意見往往是不公開的,如此一來,評審意見本身是否合理就缺乏公開透明的商榷討論。而且,大多數審稿工作都報酬輕微甚至是義務勞動,評議人很多時候對審稿缺乏積極性,評議質量因此也就下滑。
有鑑於此,學界一直有人在關注同行評議制度的改革。比如有人呼籲將同行評議的盲審形式改為開放評審,也有人建議將在評議環節的重心後移,讓評議更多地在論文發表之後進行。這兩種建議都有相當的啟發性,但是這樣的改革卻難以輕易的在已經成熟執行多年的同行評議制度上進行。
反觀網際網路學術打假這一現象,我們會驚訝地發現,學術偵探們兼具上述兩個建議的核心理念——開放性與追溯性。
  • 開放性
學術偵探雖然大多出身於研究人員,或者至少接受過學術訓練。但他們大多數時候都不具備“同行評議”意義上的專業背景。他們經常去審查自己專業領域之外的論文的資料。這不啻一種“外行評議”。聚德霍夫也著重批評了這一點,他稱之為“沒有科學專業知識證據的指控”。
然而,正是因為評議的低門檻,使得論文評議的開放性成為可能。更多的人參與到了評議活動中來,他們採取一些新型工具(比如AI影像比對工具),引入一些新的審議方法(比如運用統計學評估資料重複的可能性),不必藉助領域內的專業知識,就能找出學術造假的證據。而且很多時候,他們的方法都十分有效。這些方法的創造性應用及發展,離不開學術偵探們的活躍。
這種開放性引入了更多的人參與到論文評議當中來,而新的評議方法允許人們在不完全具備專業知識的情況下,就能對研究的可靠程度進行評估。這無疑能夠在相當程度上彌補同行評議制度的侷限。
  • 追溯性
同行評議是一種發表之前的評議。這是因為,同行評議本質上是為了維護期刊的內容質量而設立的。但顯然,論文發表後的評議的重要性,並不亞於發表前的評議。我們甚至可以斷言,一個良好的、健全的監督評價體系,必然要求在論文出版之後能夠對其進行評價。學術偵探所作的工作的追溯性,正是這種“發表後評議”的重要探索。
除了這兩個核心理念,網際網路學術打假還有一個十分重要的條件,即社交媒體強大的傳播能力。正是這種傳播能力使得學術偵探的發現能夠在短時間內發揮出巨大威力,並且可以最終形成壓力促使論文作者及出版商採取相應措施。可以說社交媒體產生的輿論壓力,是網際網路學術打假模式得以成立的基本條件之一。
當然,聚德霍夫及陳路等科學家的擔憂不無道理。網際網路學術打假確實可以規範出版行為,監督學術誠信問題。但這種打假行為如果失去重心,最終發展為一種引導網路輿論暴力對科學家進行吹毛求疵式的苛責,則也是一個災難性的後果。如果網際網路學術打假確實是一個可行的模式,學術偵探確實是一個具有存在意義的職業,那麼聚德霍夫等人擔憂的問題就必須予以充分注意並解決。
總而言之,聚德霍夫系列事件具有更為深遠的意義。它應當能為人們審視網際網路學術打假、同行評議制度,提供更具啟發性的視角。為學術界評價體系的發展給予參考。
參考文獻:

[1] https://retractionwatch.com/2025/02/14/icymi-second-retraction-nobel-thomas-sudhof/#more-131061

[2] https://www.cell.com/neuron/fulltext/S0896-6273(25)00074-1
[3] https://pubpeer.com/publications/DAF32F6DB6C166337E5381F769AE52#11
[4] https://pubpeer.com/publications/F7C42C356B2E7049FDB68A434EF4F8#78
[5] https://med.stanford.edu/sudhoflab/integrity—pubpeer.html

相關文章