
DeepSeek的模型能在一個對話機器人app上使用。來源:Mladen Antonov/AFP via Getty
來源 | 自然系列
撰文 | Elizabeth Gibney
兩週前,一家中國公司推出的DeepSeek-R1讓美國股市大幅震盪——DeepSeek-R1是一款平價但強大的人工智慧(AI)“推理”模型。
經過反覆測試,DeepSeek-R1回答數學和科學問題的能力與o1模型不相上下——o1是由加州舊金山OpenAI公司去年9月推出的一款模型,OpenAI的推理模型一直被視為行業頂尖水準。
雖然R1在科研人員想嘗試的各種任務上仍力有不逮,但它讓全球科學家有機會根據其學科內的問題,量身訓練定製款的推理模型。
“基於它的絕佳表現和低成本,我們相信Deepseek-R1能鼓勵更多科學家在日常科研工作中使用大語言模型(LLM),同時不同擔心成本問題,”俄亥俄州立大學的AI研究員Huan Sun說,“幾乎所有從事AI的同事和合作者都在談論它。”
開放季
對於科研人員來說,R1的平價和開源可能會改變傳統:使用它的應用程式設計介面(API),就能以其專利競品收取的一小部分費用對這個模型提問;其線上對話機器人DeepThink(深度思考)的使用更是免費。科研人員還能在自己的伺服器上下載這個模型,免費執行和拓展模型——這些都是閉源競品模型o1辦不到的。
R1從1月20日推出以來,“大量研究人員”基於R1或以R1為靈感,嘗試訓練自己的推理模型,加拿大不列顛哥倫比亞大學的AI研究員Cong Lu說道。這從開放科學AI資源庫Hugging Face的資料中便可看出——DeepSeek-R1的程式碼就儲存在Hugging Face上。在模型釋出後的一週內,Hugging Face上各版本的R1下載量就超過300萬次,包括獨立使用者已經擴充套件過的模型。
科研任務
推理跨越
原文以Scientists flock to DeepSeek: how they’re using the blockbuster AI model標題發表在2025年1月29日《自然》的新聞版塊上
© nature
Doi:10.1038/d41586-025-00275-0
版權宣告:
本文由施普林格·自然上海辦公室負責翻譯。中文內容僅供參考,一切內容以英文原版為準。歡迎轉發至朋友圈,如需轉載,請郵件[email protected]。未經授權的翻譯是侵權行為,版權方將保留追究法律責任的權利。
© 2025 Springer Nature Limited. All Rights Reserved
本文轉載自公眾號“自然系列”

