從產業到科學–ChatGPT問世兩年多以來中美人工智慧競爭態勢

文 | 寧南山
雖然已經兩年多過去了,但我仍然清楚地記得2022年11月30日ChatGPT釋出的時候,它帶給國內的巨大震撼。那兩天,它可以說是中國最熱門的新聞了。
所有人都驚訝地第一次發現,一個軟體竟然能夠像人類一樣和我們用自然語言流暢地進行對話。當時讓人感覺美國又率先在人工智慧方面領先了中國一大步。
而且這讓人產生了落後的擔憂和焦慮,畢竟人和機器互動方式的每一次進步,都會帶來巨大的革命性改變,比如當年的計算機最開始是各種命令列介面,後來出現了不需要輸入命令的圖形介面,微軟在1985年11月釋出的Windows 1.0就長這樣(圖形介面),直接點選圖形化的按鈕就好了。

再後來微軟在1995年8月釋出了Windows 95,有了開始選單、工作列和桌面圖示,變成了現在的經典桌面,獲得了巨大的成功。
同樣地,蘋果手機在2007年1月釋出了iPhone,把鍵盤變成了觸控式螢幕輸入,大大提高了手機的螢幕佔比,從而開啟了智慧手機時代,並且顛覆了之前的大部分手機巨頭。因此ChatGPT這種全新互動方式的出現,也很容易讓人想起歷史上這類故事,讓人覺得會不會又一個屬於美國的Windows,iPhone時刻要來了。
不僅如此,在ChatGPT出現之前的三個月,美國政府已經在當地時間8月26日通知英偉達對中國禁售A100和H100高階AI GPU,這意味著硬體效能方面中國已經受到了限制,中國公司已經沒有辦法購買高效能的英偉達硬體來訓練大模型了。所以當時這種“中國在AI大模型落後,再加上硬體又被美國製裁”的局面,一度讓人對中國人工智慧的前景感到擔憂。
但2025年的今天,我們顯然已經可以暫時鬆口氣,我說的倒不是中國的人工智慧已經像六代機一樣領先美國了,而是說中國追趕的速度還是令人滿意的,為什麼呢?我就說四點:
第一點先說硬體,在國產算力方面,華為等企業已經扛起了提供國產算力的重任。
這幾年在英偉達硬體底座可得性越來越差的情況下,國產AI算力主要就是華為的昇騰硬體底座,其在國產硬體中份額最高。國家層面2022年規劃建設的八大算力樞紐(京津冀、長三角、粵港澳大灣區、成渝、內蒙古、貴州、甘肅、寧夏),國產算力大部分用的就是華為的昇騰,佔據絕對優勢。
華為不只是幫助國內電信運營商,以及各行各業頭部企業自己建立算力中心。這幾年,華為雲在國內也建立了三大算力中心,為國內的企業提供人工智慧應用需要的雲算力。畢竟除了行業頭部企業之外,絕大部分的企業並無自建AI算力中心的能力和資金,但又需要應用AI,同時不少企業還有算力潮汐需求。華為雲這三大算力中心分別在內蒙烏蘭察布、貴州貴安和安徽蕪湖,而且在技術方面還各有特色。
貴安是華為雲全球規模最大AI算力中心,而且能效極高,其使用液冷散熱技術使得年均PUE居然只有驚人的1.1(通俗的說就是1.1度電裡面有1度用來跑算力,只有0.1度浪費了)。
而蕪湖則是最新建成的,也是技術領先的算力中心,它可以說是東數西算蕪湖叢集首個開服的專案,標誌著華為雲全球存算網的樞紐節點佈局全面完成。它採用最新的CloudMatrix架構,而且對長三角等發達地區時延很低,僅僅10ms時延的光纖網直達華東及中部城市,滿足對即時反饋要求高的業務需求。
目前華為雲的昇騰AI雲服務已經能夠支援業界100+的主流大模型執行,並且能夠做到叢集故障10分鐘內恢復。
實際上,華為雲已經洞察到未來人工智慧效能增長一定會帶來更大的算力需求,因此華為雲規劃研發了下一代技術CloudMatrix。簡單來說,就是AI大模型預訓練一定需要成百上千臺伺服器同時工作,這是一個大的叢集,不能只從單個伺服器節點效能來考慮,而是要從叢集整體效能來考慮。
CloudMatrix技術將算力集群裡面的CPU、NPU、DPU、儲存和記憶體等資源全部互聯和池化,從單體算力向矩陣算力演進,建一切可池化、一切皆對等、一切可組合的AI原生雲基礎設施,為企業提供澎湃的AI算力。
也就是說,算力集群裡面任何一臺伺服器上面的CPU、NPU、儲存等等,都是AI訓練和推理可以呼叫的資源。
CloudMatrix架構還利用華為在通訊技術全球領先這一點,透過超高頻寬的Scale-Up網路實現從“傳統乙太網”向“共享匯流排網路”演進,把所有的硬體資源全部高速互聯起來,計算叢集內所有硬體資源全部實現對等連線,再透過瑤光智慧雲腦對這些雲上資源進行統一建模、靈活排程組合,按需提供給應用,覆蓋大模型和小模型的訓練和推理。
根據華為的測試,應用了CloudMatrix技術後,盤古大模型在訓練場景與傳統架構相比,稠密模型可以提升20%的效率,稀疏模型可以提升60%的效率。在推理場景效能也能提升30%。
第二點是大模型技術中國在逐漸趕上來了,而且已經豐富多彩了。
根據不同的特色,現在我可以簡單地把國產大模型分為幾類:
1、有拼多多型別的,例如最近這段時間火爆的是12月26日釋出的DeepSeek V3開源語言大模型,它火爆倒不是因為效能大大超過了國外同行,而是同樣效能下對算力的節省表現的不錯;
2、還有經常出現在各種全球大模型排行榜的,比如通義千問、智譜清言等;
3、還有日常普通人用的最多的,比如位元組的豆包、月之暗面的kimi、百度的文心一言之類。現在在百度搜索欄操作,就呼叫了文心一言大模型的AI搜尋能力。2024年11月的日活使用量,豆包已經逼近900萬,而在2024年大火的kimi日活也有300萬了,注意這是日活,已經是很高的使用量了,而且還在迅速增長。尤其是這個豆包,aicpb網站的排名說2024年11月的MAU(月活使用者)人數已經5998萬了,全球僅次於ChatGPT的2.8725億排名第二。
4、基於行業場景,作用於改變業務流,提升生產力效率的行業大模型。典型的如華為雲的盤古大模型,科大訊飛的星火大模型等等,都在行業已經有不少應用。這部分雖不為大眾所熟知,卻是紮紮實實帶來行業變革,促進經濟增長的“數智引擎”。
2024年11月18日,分析機構沙利文(Frost& Sulivan)釋出了《中國行業大模型市場報告,2024》,其中提到華為雲的盤古大模型,在行業大模型領域取得政務、工業、金融3個市場份額第一,其中政務大模型領域盤古大模型份額佔50%,工業大模型領域盤古大模型佔38%,金融大模型領域盤古大模型份額為33%。
這三個行業,政務和金融都關係到國家安全和穩定,工業則是中國的根基,他們都是選擇華為雲盤古大模型的最多。普通消費者聽說過華為雲盤古大模型的人並不太多,是因為華為雲對盤古大模型的定位是更多地專注於to B的產業應用領域。到2024年5月,華為雲盤古大模型都已經迭代到5.0版本了。展現了讓我覺得非常強大的功能,比如建築設計師畫個草圖,盤古大模型就能給建築上色,並生成360度的建築影片,對於設計師來說節省了大量的精力和成本。
再比如這個功能也實在驚豔,你拍一個影片,盤古大模型就能夠自動變成動漫,而且表情和長相都還是一樣,這對影視製作來說能大大提高效率。
另外值得一提的是,科大訊飛的星火大模型也是基於昇騰雲算力在執行。
所以你看,從2022年11月30日到今天也才兩年多的時間,中國的人工智慧大模型就迅速湧現,並經歷了從“百模大戰”到已經有頭部的大模型開始脫穎而出的態勢,並且他們還各有特色。雖然說這兩年都在反內卷,但另一方面,進步也確實快。
第三點是中國的AI在各行各業的應用的廣度和深度已經非同一般,這方面我認為已經超越美國。
當地時間12月20日,美國《華盛頓郵報》發表了對前谷歌CEO埃裡克·施密特(Eric Schmidt)的專訪影片。他說中美兩國在人工智慧領域在進行史詩般的鬥爭,印象最深的還是他說了以下兩句話:
中國能夠把人工智慧技術應用到現實世界中,這是我們只能夢想的事情。”
“我認為有充分的理由相信,即使我們贏得了比賽的第一部分,中國最終也會贏得比賽,因為他們能夠在批次生產中更快地應用這種技術。”
施密特在中國其實算比較有名了,就在一年多以前的2023年10月,他還很自信地說中國的人工智慧落後美國,但一年多後已經開始擔憂中國會最終贏得比賽了,理由是中國能把AI用起來。

人工智慧在中國最讓我們熟知的應用就是智慧手機以及自動駕駛,現在沒有自動駕駛和智慧座艙功能的汽車,在中國市場已經賣不出去了,而智慧化程度高,自動駕駛功能強大的汽車,比如問界M9則在2024年大定20萬輛,佔了中國市場售價50萬人民幣以上汽車銷量的一半,歷史上第一次在該領域超過了國外品牌。

1月8日,中國科協、清華大學和環球時報社聯合釋出了2024年“新質生產力產業實踐示範案例”50強榜單。
我看了下這些案例,發現AI在國內各行各業的應用已經非常普遍,幾乎各行業的頭部企業都已經進行了實質性的AI應用,我這裡從這些案例裡面舉幾個例子:

1)物流行業

順豐的豐語大模型,這是專為物流行業設計的AI語言模型,摘要準確率超95%,已在20多個業務場景中應用。快遞小哥要是有專業問題可以用手機問豐語,比如某個物品能不能寄某個國家,答案就會立刻出現,這顯著提升物流服務效率和質量,而且能讓新員工的工作效率接近老員工,減少出錯機率,更快學習成長。再比如自動填單功能,使用者在輸入的時候,豐語大模型會自動猜測想填的內容,直接點一下就自動填好了,無需各種文字輸入。

2)網際網路行業

騰訊音樂打造MuseLight大模型推理加速引擎,能為使用者個性化推薦音樂,根據歌曲的內容自動生成合適的歌單封面,還能為創作者作曲提供各種推薦和靈感,並快速地建立樂譜,大大提升創作效率;另外還可以進行音樂版權檢查,版權糾紛顯著下降。
3)製造行業
安徽海螺水泥集團也將大模型應用到了生產流程。水泥熟料‌是一種半成品,主要用於製造水泥。它是由石灰石、粘土和鐵質原料按適當比例混合後,經過高溫煅燒部分熔融並快速冷卻而得到的產物。國家規定要求水泥熟料3天和28天后的強度要達標,才能用於生產水泥,很顯然如果放置這麼多天後才發現強度有問題,那就影響了生產。而透過大模型則可以進行3天和28天強度的預測,可以在早期就發現問題。值得一提的是,海螺的大模型開發依託的就是華為雲盤古大模型。
中國應用了AI的行業遠不只是以上。上海寶武鋼鐵熱軋生產線每次調整生產鋼板的種類和尺寸,都需要工程師重新調整7道精軋機組的300多個引數,需要耗費約5天的時間。他們使用了華為雲盤古大模型後,能夠對最優引數進行預測,顯著降低熱軋生產線調優時間,並提高預測精度和鋼板成材率。盤古大模型在寶鋼1880熱軋生產線上線後,預測精度提高5%以上,鋼板成材率提升0.5%,預計每年可以多產鋼板2萬餘噸,年收益達9000餘萬元。
中國的動車也大量使用了AI技術。全國每天需要檢測的動車大概有3.2萬節車廂,過去需要大量的巡檢工人在凌晨時段去完成,耗時耗力。如今結合盤古大模型和巡檢機器人,可精準識別一列動車的3.2萬個項點(檢查點),覆蓋8大類、350多種複雜故障,極大提高了高鐵運營效率,降低了成本,也減少人工在凌晨時段去巡檢的艱辛作業。
能源行業的山東能源,電力行業的南方電網、國家電網等等,都已經在應用AI,像國家電網的輸電線路竟然長達兩百多萬公里,他們已經購買了至少幾萬架無人機做巡檢,它們透過AI視覺就可直接判斷有無問題。
第四點是中國對人工智慧的應用已經開始從產業應用向科學研究應用擴充套件,稱之為AI4S(AI for Science),我認為以中國AI在產業方面應用的成功,也將在科研方面再次進行復制。
2024年的諾貝爾獎已經讓全球科學家感受到了AI的衝擊,諾貝爾物理學獎給了兩個構建了AI神經網路(當前AI大模型的基礎技術)的科學家,諾貝爾化學獎三個得主中的兩個是因為開發了能預測蛋白質的大模型。
產業對應的是科技的應用,科研則是科技的誕生,實際上當前已經有不少中國科研領域使用人工智慧的案例。比如我在西安交通大學的官網上,發現他們講該校第一附屬醫院劉冰教授團隊聯合華為雲開展的研發專案“華為雲盤古藥物分子大模型輔助新靶點新類別廣譜抗菌藥研發”入選2023 AIIA (中國人工智慧產業發展聯盟)人工智慧十大先鋒案例。
劉冰教授主要是想解決細菌耐藥性危機,因此要研發能夠消滅耐藥菌的抗生素,最終聯合華為雲,基於盤古藥物分子大模型成功發現了廣譜抗菌藥肉桂醯菌素。
藥物的研發其實比較枯燥,就是要找出具備潛在藥效的小分子化合物(小分子才能進入細胞,所以通常口服藥物是小分子化合物,當然也有大分子藥物,通常是注射的,作用於細胞表面),但自然界各種分子實在太多了,不可能用窮舉法,因此匯入AI來判斷和預測是個好辦法。
使用盤古藥物分子大模型對自然界中已存在的17億個分子結構進行預訓練,生成了1億全新的小分子化合物的資料庫,這些小分子具備高類藥性,並且結構新穎性約達100%。
此外,盤古藥物分子大模型還可以兼具小分子-蛋白結合預測、小分子的80多種屬性預測、小分子最佳化與生成等藥物研發的關鍵環節所需的功能,科研團隊利用這些功能,進行進一步篩選,最終成功從海量的小分子化合物中篩選出了具備潛在藥效的小分子。AI極大地推動了新抗生素的研發,目前肉桂醯菌素正在穩步推進臨床研究。
這並不是華為雲AI在科研方面的唯一應用,像南方科技大學坪山生物醫藥研究院的抗流感藥物研發,北京大學的基因研究,深圳海洋局的全球海洋預報,中國農科院的育種研究,都有華為雲的身影。
華為雲也看到了科研領域對AI的巨大需求,因此也專門打造了AI4S平臺助力科研機構一站式開發:
AI4S平臺除了給各大高校和科研機構提供昇騰算力以及對應的硬體加速套件/加速庫之外,還已經針對十幾個科研領域(包括生物醫藥,計算化學,地球科學,電磁學,流體模擬,量子力學等)適配了包括華為自研以及第三方大模型在內的80多種模型。全國的科研使用者可以實現開箱即用,還可以自己對模型進行二次開發。值得注意的是,這裡的科研使用者不僅僅是高校和科研機構,企業現在也是我國科技研究的主力軍。
2023年中國科學家發表在三大頂刊CNS(《細胞》《自然》《科學》)期刊論文數量世界第二位,僅次於美國,頂尖科研成果的產出距離美國越來越近。中國的科研領域也開始大量應用AI的話,將會像產業領域一樣,在AI應用方面走在美國的前面,這將大大加速中國頂尖科技成果趕超美國的時間。
老實說,美國這些年的制裁,反而把在美國技術基礎上構建的中國AI能力,從硬體底座到大模型,都徹底逼向了自主創新和研發。而這些年我們也逐漸發現,我們在應用到行業方面的能力是如此之強,規模是如此之大,畢竟光是一個製造業,我國論增加值也已經是美國的兩倍了,論產量更是對美國壓倒性優勢。
就拿被美國人視為命脈的汽車產業,根據國際汽車製造商組織(International Organization of Motor Vehicle Manufacturers)提供的資料顯示,2023年全球汽車總產量達到了令人矚目的9350萬輛,中國產量3016萬輛,美國1061萬輛,中國幾乎是美國的三倍,也是有史以來第一個產量突破3000萬輛的國家。
科研領域也是一樣,中國的科研支出在不斷增長,R&D支出位居世界第二位,而且強度還不低,根據國家統計局公佈,2023年R&D佔GDP比例為2.65%,位居世界第12位,甚至超過了大部分發達國家。這意味著隨著GDP總量增長,我國科研支出遲早是世界第一。
中國從產業到科研這麼大規模,如果AI應用都構建在美國軟硬體技術基礎上,那就是用中國龐大的市場拉動了美國公司的成長。而在這幾年美國不斷加碼制裁的情況下,龐大的中國本土市場,以及國內千行百業積極的擁抱和應用AI,開始顯現出了對於國產算力和大模型發展的強大拉動作用,這兩年國產算力和大模型已經逐漸呈現燎原之勢。
封鎖和制裁,對能力弱的國家是有用的,對以前中國基礎非常薄弱的時候也是有用的,但對現在的中國不太管用,封鎖個十年八年,你會發現中國啥都有了。

相關文章