“DeepSeek的出現,對於美軍是好事”

中國人工智慧(AI)企業DeepSeek(深度求索)推出的生成式大模型在全球當真是火爆了——從美國國會到五角大樓各方的接連禁令,就很能說明問題。老司機注意到一件特殊的事——五角大樓雖然頒佈了DeepSeek的禁令,但對於DeepSeek提出的AI發展新思路,卻充滿興趣。就連美國媒體也承認,DeepSeek的出現對於美軍而言實在是好事。
這還得從美軍對於AI的濃厚興趣說起。美國《防務新聞》網站4日提到,美軍近年大力投資AI領域,希望利用AI協助美軍提高部署效率。例如美國海軍陸戰隊3日釋出的一項修訂版航空戰略,其重點就是使用自動系統、無人機和AI驅動的軟體,“以確保其戰鬥機群能夠在激烈的戰區中生存”。
但麻煩在於,美軍想要發展AI,與其他AI企業面臨同樣的問題——需要依託海量的算力和電力供應。五角大樓官員警告說,美國缺乏支援大規模AI基礎設施所需的能源資源和計算能力,“解決這個問題並不容易”。《防務新聞》提到,儘管五角大樓有一個雄心勃勃的願景,即使用AI協助資料收集、情報分析、戰役和後勤等任務,但根據美國主流的大模型技術路線,執行這些AI程式所需要的海量電力和算力基礎設施“超出了五角大樓的能力”。
美國主流AI大模型所需要的龐大資源,從特朗普政府推動的“星際之門”計劃就可見一斑——OpenAI、軟銀和甲骨文等科技巨頭不久前宣佈將共同投資5000億美元,在美國各地建設新的AI基礎設施,旨在確保美國在全球AI競爭中的領先地位。
美國防部負責研究和工程的副部長辦公室高階計算副主任羅伊·坎貝爾承認,很多時候美軍的海外基地不具備訓練AI所需的計算能力,“在某些情況下,為了解決前線作戰基地無法處理的問題,必須將這些資料傳輸回美國本土並使用國防部超級計算中心才能得到結果。”這種做法無疑極大降低了效率,而且還對通訊穩定提出了很高的要求。
那麼怎麼才能提高基礎設施不足的前線基地的AI能力呢?《防務新聞》透露,美軍甚至將主意打到了移動式核反應堆上,希望用它為前線基地的AI大模型提供電力。該反應堆原型設計指標是滿功率下能至少執行3年,提供1至5兆瓦的電力。原先設計的目的是為偏遠基地提供穩定的電力供應,為了能實現快速運輸和部署使用,它將被設計為能在交付的3天時間內投入執行,並能在7天時間內安全地撤離。
但由於這種移動式核反應堆存在諸多安全和成本問題,該專案進展並不順利。如今美軍為了AI也開始“病急亂投醫”,五角大樓戰略能力辦公室負責開發移動核反應堆工作的傑夫·瓦克斯曼透露,為應對AI和高功率計算等技術給電網帶來的巨大壓力,這種移動式核反應堆理論上可以利用核能為AI計算獲取穩定的電力供應。
而DeepSeek的出現,讓美軍突然發現了一條全新的技術路線——它僅需要耗費OpenAI等美國AI公司訓練大模型所用時間和資金的一小部分,就實現了足以匹敵美國頂尖AI模型的效果。也就是說,如果DeepSeek的技術得到普及,未來美軍前沿基地面臨的AI能源供應短缺問題可能就不復存在了。
美國“防務一號”網站稱,更進一步看,DeepSeek的突破提供了構建更高效工具的機會,這同樣有利於美軍。因為美國主流的“越大越好”的AI大模型發展思路(獲得更多訓練資料、生成更大的模型、構建更大的資料中心)正在擠壓美軍真正需要的邊緣計算專案。因為在美軍的實際工作中,並不需要通用大模型的複雜功能,主要需求集中在幾個特殊領域。例如前線部隊會面臨各種需要AI介入的情況,包括利用AI從無人機或衛星照片資料中篩選特定型別的車輛、解析他們遇到的某種電磁訊號特徵,甚至只是瞭解當地的經濟、天氣、人口或消費者資料,“以便在密集的城市環境中規劃更有效和安全的行動”。
在這些場景中,美軍需要的是依託相對較小資料執行的AI模型,其算力“不需要大量的伺服器或GPU作為支援”。相反,由於前線地區情況多變,可能充滿敵方電磁干擾,或者是在電力供應不足且通訊較弱的前沿小型基地,因此DeepSeek這樣只需要相對較少的算力和電力資源的高效工具,其實才更符合五角大樓的需要。
因此美軍對於DeepSeek的複雜感覺,其實也印證了中國常駐聯合國代表傅聰的相關表態。傅聰於北京時間2月4日在紐約聯合國總部舉行的記者會上表示,“永遠不要低估中國科研人員的聰明才智。DeepSeek引發全球轟動和一些人的焦慮恐慌,說明技術遏制和技術限制無法奏效,這是全世界、特別是美國需要學習的一課。”傅聰表示,“我們不需要更多禁令,中美作為在當今AI領域最領先的兩個國家,不能不合作。只有共同合作發展,才能彌合數字和智慧鴻溝,特別是幫助全球南方在AI發展程序中平等受益。”
熱文推薦

相關文章