編輯:張倩、+0
第 42 屆國際機器學習大會(ICML)將於 2025 年 7 月 13 日至 19 日在加拿大溫哥華舉行。剛剛,ICML 官方向投稿者傳送了今年論文接收結果的通知。
資料顯示,今年大會共收到 12107 篇投稿,較去年增加了 28%。共有 3260 篇論文被接收,接收率為 26.9%。其中,只有 313 篇論文被選為「spotlight poster」。
在收到郵件的第一時間,不少研究者都曬出了自己被接收的論文。當然,也有研究者感到沮喪或對評審結果有所質疑。在這篇文章中,我們彙總了一些被接收的優秀論文以及有爭議的論文,方便大家探討。
被接收的高分論文
首先,我們檢索了一些 spotlight 論文,因為這是 ICML 官方推薦度最高的一批論文,能搜到的論文包括但不限於:
-
Neural Discovery in Mathematics: Do Machines Dream of Colored Planes?(數學中的神經發現:機器會夢見彩色的平面嗎?)
-
Monte Carlo Tree Diffusion (MCTD) for System 2 Planning(用於 System 2 規劃的蒙特卡羅樹擴散(MCTD)方法)
-
Layer-wise Alignment:Examining Safety Alignment Across lmage Encoder Layers in Vision Language Models(逐層對齊:視覺語言模型中影像編碼器層間的安全對齊)
-
The Number of Trials Matters in Infinite-Horizon General-Utility Markov Decision Processes(試驗次數在無限時域一般效用馬爾可夫決策過程中的重要性)
-
Implicit Language Models are RNNs: Balancing Parallelization and Expressivity(隱式語言模型即 RNN:平衡並行性與表達能力)
-
……




此外,我們還發現,一些國內大廠的論文在評審中拿到了高分或 Spotlight,比如字節跳動的兩篇論文:
論文 1:MARS: Unleashing the Power of Variance Reduction for Training Large Models(平均得分:4.25)

MARS 是一個用於 LLM 的方差縮減自適應最佳化器框架,其收斂速率為𝒪(T⁻²/³),優於 AdamW 的𝒪(T⁻¹/²)。該方法的 2.0 版本將在之後釋出。
論文 2:ShadowKV: KV Cache in Shadows for High-Throughput Long-Context LLM Inference(Spotlight)

還有一些論文雖然拿到了高分,但並未被選為 Spotlight,這類論文同樣值得關注,比如下面這篇伊利諾伊大學厄巴納-香檳分校的論文:EMBODIEDBENCH: Comprehensive Benchmarking Multi-modal Large Language Models for Vision-Driven Embodied Agents(平均得分:4.5)

-
連結:https://arxiv.org/pdf/2502.09560

EmbodiedBench 是一個用於評估多模態大語言模型(MLLMs)作為視覺驅動的具身智慧體的綜合性基準測試平臺。它包含 1128 個測試任務,涵蓋四個環境,從高階語義任務(如家務)到涉及原子動作的低階任務(如導航和操作)。此外,EmbodiedBench 還設有六個精心策劃的子集,用於評估智慧體的關鍵能力,如常識推理、複雜指令理解、空間意識、視覺感知和長期規劃。
充滿爭議的被拒論文
除了被接收的論文,一些被拒的論文同樣值得討論,因為這些論文的價值可能未被充分挖掘。
一個研究者曬出了元評審截圖,儘管其論文獲得高度評價,卻仍被拒絕。

這並非孤例,其他研究者也反映了類似遭遇。

令人費解的是,一些評分較低的論文反而被接收。

另一位研究者表示,他收到了不完整、無關且敷衍的評審意見。雖然向科學誠信委員會舉報並得到確認該評審質量確實低下,但領域主席(AC)依然拒絕了他的論文。

評審過程中的矛盾同樣引人關注。
有研究者發現,他的論文實際獲得了兩個 4 分,但元評審卻錯誤地將其記錄為三個 3 分加一個 4 分。同時,元評審聲稱某位評審人還有疑問,而該評審人在反駁階段已明確表示其疑慮已解決。

其他研究者也指出了評審和編輯的粗心。

如果你對自己論文的接收結果也有疑問,歡迎在評論區討論。
© THE END
轉載請聯絡本公眾號獲得授權
投稿或尋求報道:[email protected]