火遍全球的DeepSeek:科學家是怎麼用它的?

DeepSeek的模型能在一個對話機器人app上使用。來源:Mladen Antonov/AFP via Getty
來源 | 自然系列
撰文 | Elizabeth Gibney
兩週前,一家中國公司推出的DeepSeek-R1讓美國股市大幅震盪——DeepSeek-R1是一款平價但強大的人工智慧(AI)“推理”模型。
經過反覆測試,DeepSeek-R1回答數學和科學問題的能力與o1模型不相上下——o1是由加州舊金山OpenAI公司去年9月推出的一款模型,OpenAI的推理模型一直被視為行業頂尖水準。
雖然R1在科研人員想嘗試的各種任務上仍力有不逮,但它讓全球科學家有機會根據其學科內的問題,量身訓練定製款的推理模型
“基於它的絕佳表現和低成本,我們相信Deepseek-R1能鼓勵更多科學家在日常科研工作中使用大語言模型(LLM),同時不同擔心成本問題,”俄亥俄州立大學的AI研究員Huan Sun說,“幾乎所有從事AI的同事和合作者都在談論它。”
開放季
對於科研人員來說,R1的平價和開源可能會改變傳統:使用它的應用程式設計介面(API),就能以其專利競品收取的一小部分費用對這個模型提問;其線上對話機器人DeepThink(深度思考)的使用更是免費。科研人員還能在自己的伺服器上下載這個模型,免費執行和拓展模型——這些都是閉源競品模型o1辦不到的。
R1從1月20日推出以來,“大量研究人員”基於R1或以R1為靈感,嘗試訓練自己的推理模型,加拿大不列顛哥倫比亞大學的AI研究員Cong Lu說道。這從開放科學AI資源庫Hugging Face的資料中便可看出——DeepSeek-R1的程式碼就儲存在Hugging Face上。在模型釋出後的一週內,Hugging Face上各版本的R1下載量就超過300萬次包括獨立使用者已經擴充套件過的模型。
科研任務
一些初步測試讓R1執行資料型科研任務——這些任務選自生物資訊、計算化學、認知神經科學等領域的真實論文——結果R1的表現與o1不相上下,Sun說。她的團隊讓這兩個AI模型完成他們建立的一系列問題中的20個任務,這個系列被稱為ScienceAgentBench。這些任務包括資料分析和視覺化。兩個模型只能答對其中約1/3的問題。用API執行R1的成本只要o1的1/13,但R1的“思考”時間比o1更長,Sun說。
R1在數學上也開始嶄露頭角英國牛津大學的數學家、計算科學家Frieder Simon讓這兩個模型給出泛函分析這一抽象領域的一個證明,發現R1的證明比o1的更好。但考慮到這類模型通常會犯的錯誤,如果想要從這些模型中獲益,研究人員本身就要具備鑑別證明水平的能力,他說。
R1令人激動的一大原因在於,它以“open-weight”(開放權重)的形式公開說明其演算法不同部分之間習得的關聯可以進一步拓展。下載了R1或其“蒸餾”小模型(也由DeepSeek釋出)的科學家能透過額外訓練提升其能力,這也稱為微調。如果有合適的資料集,科研人員或能透過訓練,提高該模型在特定科研步驟編寫程式碼的能力。
能在本地系統下載並部署R1也是個加分項,Sun說,因為這樣科研人員就能掌控他們的資料和研究結果。“對於涉及敏感和隱私資料的學科來說,比如醫學研究,這一點尤其重要。”
推理跨越
DeepSeek也攪動了AI科研領域,因為它指出了一條能最佳化無數其他模型的道路,舊金山AI公司Anthropic的聯合創始人Jack Clark說。Clark的模型叫Claude。
DeepSeek透過將它的“推理”能力教授給其他大語言模型(LLM)——如Meta的Llama——建立了這個蒸餾模型。DeepSeek在1月22日在arXiv上釋出的預印本論文[1]揭示了這背後的方法:用整理好的來自DeepSeek-R1的80萬個逐步式“思維鏈”回答的樣本訓練這些大語言模型。
“現在網上有了一個開放權重的模型,你能用它讓其他足夠強大的基礎模型變身為一個AI推理器,”Clark在他的簡報Import AI中寫道,“全球的AI能力又向前了一步。”
科研人員還在應用“強化學習”——用來建立DeepSeek-R1的試、錯、賞技術——但打磨它在特定任務上的應用,Lu說。Lu去年聯合建立了“AI Scientist”,這是一個能完成一整套機器學習科研任務的模型,從掃描文獻到建立假說再到撰寫論文。透過定義適當的“獎賞訊號”,科學家能朝著任何目標訓練這個模型他說。
但DeepSeek-R1還遠談不上完美。對話機器人DeepThink在o1等大語言模型會“碰壁”的簡單任務上也失敗了,這類問題包括統計名字中含字母W的美國州的數量。Lu說:“也許有的人認為這個模型能把水變成酒,這只是炒作,但對於其實際能力來說,它確實是最棒的。”
原文以Scientists flock to DeepSeek: how they’re using the blockbuster AI model標題發表在2025年1月29日《自然》的新聞版塊上
© nature
Doi:10.1038/d41586-025-00275-0
版權宣告:
本文由施普林格·自然上海辦公室負責翻譯。中文內容僅供參考,一切內容以英文原版為準。歡迎轉發至朋友圈,如需轉載,請郵件[email protected]。未經授權的翻譯是侵權行為,版權方將保留追究法律責任的權利。
© 2025 Springer Nature Limited. All Rights Reserved
本文轉載自公眾號“自然系列”
凡本公眾號轉載、引用的文章 、圖片、音訊、影片檔案等資料的版權歸版權所有人所有,因此產生相關後果,由版權所有人、原始釋出者和內容提供者承擔,如有侵權請聯絡刪除。
點選【在看】,及時接收我們的內容更新 

相關文章