

本文為科技分析師 Lennart Heim (@ohlennart) 在X平臺釋出的分析文章的轉述與專業解讀。
在AI晶片的戰場上,每一款新品的釋出都牽動著全球科技界的神經。尤其當這款晶片來自中國,且身處備受矚目的華為,其意義便更加非凡。近期,華為昇騰910C AI加速器的量產訊息,無疑如同在平靜水面投下巨石,激起層層漣漪。這顆被譽為“中國最強AI晶片”的面世,不僅是對華為技術實力的又一次證明,更是中國在高科技領域不屈前行的縮影。
本文將基於海外分析師 Lennart Heim 的專業拆解,抽絲剝繭,深度剖析昇騰910C背後的技術構成、效能表現與戰略意義,力求還原其在全球AI晶片競爭格局中的真實分量。
本文所有資料都已上傳至“智慧計算芯知識”星球。如“《60+份AI Agent技術報告合集》”,“《清華大學:DeepSeek報告13部曲合集》”,“浙江大學:DeepSeek技術20篇(合集)”,“《280+份DeepSeek技術報告合集》”,“《100+份AI晶片技術修煉合集》”,“800+份重磅ChatGPT專業報告”,“《12+份Manus技術報告合集》”,加入星球獲取嚴選精華技術報告。
昇騰910C的技術構成:精巧的“雙芯合璧”, 架構設計耐人尋味
並非全新架構,而是巧妙的“老將新用”?
昇騰910C的“C”,或許並非意味著一次架構上的“Critical Change”,反而更像是一次站在巨人肩膀上的“Clever Combination”。 從技術本質上來看,它並非橫空出世的全新架構,而更像是一場精巧的“合體術”——將兩顆已有的昇騰910B晶片,透過先進的封裝技術巧妙地整合在一起。
這背後的意味值得玩味。在先進製程受限的當下,與其耗費巨資強攻未知領域,不如退一步,在成熟製程上挖掘潛力,透過架構創新和巧妙設計實現效能躍升,這或許才是更務實且高效的路徑。 昇騰910C 的出現,恰恰印證了這種策略的可能性。
然而,值得我們特別關注的是,根據 Lennart Heim 的分析,這批 910C 晶片的 “出生地” 可能並非完全在我們自主可控的產線上,而是指向了一個略顯敏感的來源——臺積電。 Heim 的觀點頗具衝擊力: 這批晶片,很有可能是在更早之前,在出口管制尚未收緊之時,華為透過多方渠道儲備而來。 換句話說,我們今天看到的 910C,或許是華為在西方技術封鎖前,就已提前佈下的 “棋子”。
如果 Heim 的推論成立,那麼昇騰 910C 的象徵意義就更加複雜和耐人尋味了。它不僅僅代表了華為在AI晶片領域的最新進展,更像是一枚時代印記,記錄著特定歷史時期下,中國科技企業在全球化浪潮中,如何巧妙周旋,積蓄力量的獨特路徑。

封裝方案的“取捨之道”:效能與成本的平衡術
談及晶片封裝,這並非只是簡單的 “組裝” 工藝,而是直接關乎晶片效能、功耗乃至最終成本的關鍵環節。特別是在AI晶片領域,先進封裝技術的重要性愈發凸顯。NVIDIA 之所以能在高效能AI晶片領域獨佔鰲頭,其在先進封裝技術上的持續投入與領先優勢功不可沒。
然而,昇騰 910C 在封裝方案的選擇上,卻展現出一種耐人尋味的 “務實主義”。 它並沒有激進地追逐最前沿的封裝技術,而是選擇了相對成熟,技術難度更低的方案: 將兩顆獨立的 910B 晶片分別放置在各自的矽中介層上,再透過有機基板將兩個矽中介層連線起來。

這樣的方案,在 Lennart Heim 看來,相比 NVIDIA 動輒 CoWoS 或 Foveros 等先進封裝方案,確實顯得 “遜色” 一些。 差距主要體現在晶片間的互聯頻寬上。 Heim 預計,昇騰 910C 採用的封裝方式,可能會導致晶片間頻寬比 NVIDIA 的先進方案低上 10-20 倍!

頻寬的降低,直接影響的是晶片間資料交換的效率,進而可能限制整體效能的發揮。 這無疑是一個不小的技術 “短板”。 然而,我們也要看到這種 “取捨” 背後的考量。 更成熟的封裝方案,往往意味著更低的成本,更高的良率,以及更快的量產速度。 在當下這個特殊的時期,保證穩定量產,快速形成戰鬥力,或許比單純追求極致效能更為重要。
更何況,架構的不足,可以軟體來彌補。 Heim 也敏銳地指出, 昇騰 910C 的架構特點,勢必會對使用這款晶片的工程師提出更高的要求。軟體最佳化將會成為釋放 910C 潛力的關鍵所在。 如何透過巧妙的軟體工程,最大程度地彌補硬體架構上的 “頻寬瓶頸”,將成為昇騰 910C 能否在實際應用中真正發揮價值的關鍵。 這就好比在一場賽跑中,雖然起跑線稍稍落後,但只要策略得當,後程發力,依然有機會反超。

效能與技術引數:與H100的“實力差距”及“追趕之勢”
客觀評估: 效能引數的“80%之說”
效能,永遠是衡量芯片價值的最核心指標。 Lennart Heim 對昇騰 910C 的效能給出了較為細緻的預估。 整體來看, 910C 的效能放在當下,依然稱得上是 “實力派”, 但若與 NVIDIA 的標杆產品對標,差距依然客觀存在。
在關鍵的 FP16 精度算力上, Heim 預計 910C 大約能達到 800 TFLOPS 左右。 記憶體頻寬則預估在 3.2 TB/s 左右。 這樣的資料,與 NVIDIA 2022 年推出的明星產品 H100 相比, Heim 認為, 910C 的效能大概能達到 H100 的 80%。 這是一個相對 “保守” 但也頗為中肯的評估。
換句話說, 如果 H100 是一位 “滿分選手”, 那麼 910C 大約能拿到 80 分, 依然屬於 “優良” 的等級, 絕非 “不堪一擊”。 但我們也要清醒地認識到,這 20% 的差距,在日新月異的AI晶片領域,已經代表著不小的代差。
更值得關注的是晶片的 “邏輯面積”。 Heim 指出, 昇騰 910C 的晶片邏輯面積,竟然比 H100 大約大了 60%! 這意味著, 在相同的效能水平下, 910C 需要消耗更多的矽片面積, 這在一定程度上反映了 910C 在架構效率和設計最佳化方面, 與 H100 依然存在差距。 “塊頭更大,力氣略遜”, 這或許是對 910C 與 H100 效能對比的一個形象寫照。

代際差距:面對B200,挑戰升級
如果說與 H100 相比, 昇騰 910C 尚有 “一戰之力” 的話, 那麼面對 NVIDIA 今年即將全面鋪向資料中心的 B200 系列, 技術差距就顯得更為明顯了。
Heim 毫不諱言地指出, 與 B200 相比, 昇騰 910C 在各個關鍵效能指標上, 都存在著較為明顯的代差:
-
• 計算效能: 約落後 3 倍! -
• 記憶體頻寬: 約落後 2.5 倍!( Heim 的分析中假設 910C 使用了 HBM2E 記憶體, 當然, 華為如果真的 “彈藥充足”, 採用更高規格的 HBM3 也並非不可能, 但即便如此,要追平 2.5 倍的頻寬差距,依然難度巨大。) -
• 能效比: 更是與 NVIDIA 最新的 B200 產品拉開了明顯差距。
這意味著, 如果說 910C 在 2022 年還能勉強站在 H100 的 “影子” 下, 那麼到了 2025 年, 面對效能全面升級的 B200, 910C 的競爭力無疑將進一步被削弱。 技術代際的鴻溝, 客觀存在, 不容迴避。

供應鏈與生產:撲朔迷離的“來源之謎”與自主可控的“本土猜想”
“臺積電暗度陳倉”? 令人震驚的供應鏈推論
晶片供應鏈,向來是科技領域最敏感,也最受關注的環節之一。 特別是對於華為這樣身處 “風暴眼” 的企業, 其晶片的來源, 更是牽動著無數人的神經。 Lennart Heim 在供應鏈分析上的判斷,可謂 “語出驚人”, 甚至有些 “石破天驚” 的意味。
Heim 大膽推測, 華為之所以能夠在當下這個時間點, 推出昇騰 910C 這樣一款高效能 AI 晶片, 背後很可能得益於早期透過 “非正規渠道”, 從臺積電囤積了高達 300 萬顆 基於 7nm 工藝的昇騰晶片裸片 (dies)!
300 萬顆! 這是一個令人咋舌的數字。 如果 Heim 的推論屬實, 那麼這無疑是一場 “暗度陳倉” 式的豪賭。 在出口管制收緊之前, 華為就已預判到未來的風險, 並提前佈局, 大量囤積關鍵晶片, 為未來的發展爭取了寶貴的時間和戰略空間。
不僅如此, Heim 還推測, 華為可能還從三星電子手中囤積了足夠多的 HBM2E 高頻寬記憶體。 如果將晶片裸片和 HBM 記憶體這兩個關鍵要素結合起來, Heim 認為, 華為理論上可以生產出約 140 萬個 910C 加速器!
140 萬個 910C! 這意味著什麼? 如果全部部署到位, 按照 Heim 對 910C 單卡算力的估算, 140 萬個 910C 所能提供的 AI 算力, 將相當於 100 萬片 NVIDIA H100 級別的 AI 算力!
這是一個足以改變遊戲規則的數字。 如果華為真的擁有如此規模的 “隱藏算力”, 那麼它在全球 AI 競爭格局中的地位, 無疑將被重新評估。

“國產7nm 曙光”? 自主生產能力的“猶抱琵琶半遮面”
當然, 在供應鏈來源的 “謎團” 之外, 還有一個更受中國科技界關注的問題: 昇騰 910C 能否實現 “國產化” 生產? 或者說, 華為是否已經掌握了在本土產線上, 自主生產 7nm 甚至更先進製程晶片的能力?
對於這個問題, Lennart Heim 的觀點相對謹慎, 也更貼近現實的 “灰色地帶”。 他認為, 華為 “應該” 具備在 7nm 節點上生產 910B 和 910C 晶片裸片的能力。 這 “應該” 二字, 意味深長, 既肯定了華為在技術研發上的實力積累, 也暗示了 “實際量產” 可能還面臨諸多挑戰和不確定性。
Heim 坦言, 迄今為止, 他尚未看到 “確鑿無疑” 的證據, 例如權威機構的拆解報告, 能夠完全證實市面上流通的 910B 或 910C 晶片, 是 “Made in China” 。 因此, 他傾向於認為, 目前市面上絕大多數的 910C 晶片, “很可能” 仍然來自於 “非正規渠道” 獲得的臺積電產品。
但 Heim 也並沒有完全排除 “國產自產” 的可能性。 他認為, 國內生產 7nm 晶片, “理論上是可能的”。 只是, 大規模量產的良率、 成本、 穩定性等問題, 可能仍然是制約 “國產 910C” 大規模問世的障礙。
這種 “既有希望, 又有挑戰” 的判斷, 或許更符合中國半導體產業的真實寫照。 我們在先進製程工藝上, 確實取得了一定的突破, 但距離完全實現 “自主可控”、“規模量產”, 依然還有一段路要走。 昇騰 910C 的供應鏈 “來源之謎”, 也恰恰折射出中國科技產業, 在自主創新道路上 “摸著石頭過河” 的複雜性和艱鉅性。

戰略意義與全球AI競爭: 算力差距下的“差異化競爭”與“後發優勢”
算力差距“客觀存在”, 戰略意義“不容低估”
儘管 昇騰 910C 的效能和供應鏈來源, 依然存在諸多 “謎團” 和爭議, 但其戰略意義, 卻是不容忽視的。 Lennart Heim 從全球 AI 競爭格局的高度, 對 910C 的戰略價值, 給出了深刻的解讀。
首先, Heim 坦言, 與西方最頂尖的 AI 晶片相比, 昇騰 910C 依然存在 “差距”。 這種差距, 不僅僅體現在單卡效能上, 更體現在整體的算力規模上。 Heim 預測, 到 2025 年底, 西方陣營生產的 AI 晶片數量, 將至少是中國的 5 倍 以上! 而整體的計算能力差距, 甚至可能達到 10-20 倍! 美國的 AI 算力優勢, 依然是壓倒性的。
這是我們需要正視的 “硬實力” 差距。 但 Heim 的分析, 並沒有停留在簡單的 “數字對比” 上, 而是進一步深入到 “算力資源分配” 的戰略層面。 他敏銳地指出, 僅僅擁有 10 倍的計算能力, 固然是巨大的戰略優勢, 但如果這些算力資源, 分散在成百上千家不同的公司手中, 其戰略威力, 就會大打折扣。
而中國, 則可能在 “資源集中” 方面, 展現出獨特的優勢。 Heim 認為, 中國可能比西方國家, “更容易實現資源集中”。 這或許才是中國 AI 戰略真正的 “王牌” 所在。
集中力量辦大事, 這是中國在諸多領域屢試不爽的 “制勝法寶”。 在 AI 算力這個 “新基建” 領域, 如果中國能夠充分發揮 “資源集中” 的優勢, 將有限的算力資源, 優先投入到最關鍵、 最核心的戰略方向上, 那麼即使整體算力規模落後於西方, 依然有機會在區域性領域, 甚至在某些關鍵技術方向上, 實現 “彎道超車”。

“推理先行,應用突圍”? 差異化競爭的“中國路徑”展望
“集中優勢算力, 實現差異化競爭”, 這或許是中國 AI 戰略的 “破局之道”。 那麼, 具體應該如何 “差異化” 競爭? Lennart Heim 也給出了他的 “中國路徑” 展望。
Heim 認為, 中國在 AI 領域, 依然 “具有競爭力”。 尤其是在 AI 推理能力 方面, 中國 “可能會有更多進步”。 “推理”, 正是 AI 應用落地的關鍵環節。 相比於 “燒錢” 的 “預訓練”, “推理” 的成本更低, 更貼近實際應用場景, 也更容易產生商業價值。
或許, 中國可以揚長避短, 將有限的算力資源, 更多地投入到 AI 推理晶片和推理平臺的研發和部署上, 在 AI 應用的 “最後一公里” 上發力, 率先在 特定行業、 特定場景 實現 AI 應用的規模化落地。
例如, 在智慧城市、 智慧交通、 智慧製造、 安防監控等領域, 中國已經積累了大量的資料和應用場景優勢。 如果能夠將 910C 等國產 AI 晶片, 與這些應用場景深度融合, 打造出一批 “殺手鐧” 級別的 AI 應用, 那麼即使在 “通用 AI 大模型” 的預訓練方面, 暫時落後於西方, 依然可以在 AI 應用的商業化落地和產業化程序中, 佔據領先地位。
然而, Heim 也提醒我們, “差異化競爭” 並非 “一勞永逸” 的 “萬能藥”。 他指出, 下一代 AI 預訓練, 可能需要 “新的、 更大的叢集, 需要數萬片晶片”。 而且, 要真正發揮 AI 模型的價值, 還需要將它們 “部署給數百萬使用者, 或自主執行大量 AI 智慧體”。 此時, “總計算量仍然很重要”。
“水桶的容量, 取決於最短的那塊木板”。 算力規模的短板, 最終依然會限制 中國 AI 發展的 “天花板”。 因此, 在 “差異化競爭” 的同時, 中國也必須持續加大在 AI 基礎設施建設和先進製程工藝研發上的投入, 努力補齊 “算力短板”, 才能在全球 AI 競爭中, 贏得更大的戰略主動權。

總結與展望: 不完美但彌足珍貴, 差異化突圍的“中國式AI道路”
“80% 效能” 的背後: 戰略意義遠超引數本身
綜合 Lennart Heim 的深度分析, 我們可以對華為昇騰 910C 形成一個更客觀、 也更立體的認識:
從單卡效能來看, 910C 或許並不 “驚豔” —— 僅相當於 H100 的 80% 左右, 且釋出時間也晚了 4 年。 如果僅僅以 “引數論英雄”, 910C 似乎並無太多 “亮點”。
但如果我們跳出 “引數” 的束縛, 站在更高的戰略維度審視 910C, 就會發現, 它的意義遠不止於 “80% 效能” 本身。 在西方技術封鎖日益收緊的背景下, 華為能夠推出 910C 這樣一款高效能 AI 晶片, 本身就具有極強的象徵意義。 它證明了, 即使在 “逆境” 之中, 中國科技企業依然沒有放棄對技術高峰的攀登, 依然在努力縮小與世界頂尖水平的差距。
更何況, 如果 Heim 關於 “臺積電晶片囤積” 的推論成立, 那麼 910C 的戰略價值就更加凸顯了。 透過 “非正規渠道” 獲得的大量晶片裸片, 再加上可能從中芯國際獲得的少量 “國產 910C”, 華為完全可以透過 “叢集更多晶片” 的方式, 來彌補單卡效能的差距, 構建起規模可觀的 AI 算力叢集。
“單絲不成線, 獨木不成林”。 在 AI 時代, 算力叢集的規模效應, 往往比單卡效能的 “極致引數” 更為重要。 從這個意義上來說, 昇騰 910C 的 “價值”, 絕不能僅僅用 “80% 效能” 來簡單衡量。 它更像是華為, 乃至中國 AI 產業, 在重重圍堵之下, 巧妙利用成熟技術、 積極開拓多元化供應鏈、 並最終走出一條 “差異化突圍” 之路的 一個 “里程碑” 式的註腳。

“出口管制” 並非“失效”, “AI彈性”與“防禦AI” 或成未來關鍵詞
Lennart Heim 在文章的最後, 也對西方的 “出口管制” 政策, 進行了反思和展望。 他認為, 昇騰 910C 的出現, “並不意味著出口管制失敗”。 關鍵是要 “理解中國能夠提供什麼, 出口管制允許什麼, 以及它們不允許什麼”。
這句話, 耐人尋味, 也意味深長。 “出口管制”, 固然在一定程度上限制了中國 AI 產業的發展速度, 但卻無法完全阻止中國 AI 前進的步伐。 中國依然可以透過 “自主創新”、 “多元化供應鏈”、 “差異化競爭” 等多種方式, 在 AI 領域 “突圍”。 “出口管制” 的 “籬笆牆”, 或許可以延緩中國 AI 追趕的速度, 但卻無法 “扼殺” 中國 AI 發展的內生動力。
Heim 還預告, 他將在未來撰文, 詳細闡述 “AI 彈性”、“用於防禦的 AI” 等 “補充方法”。 這或許暗示著, 在 “出口管制” 常態化的背景下, 中國 AI 發展戰略, 需要更加註重 “自主可控”, 構建更具韌性的 AI 產業鏈, 並積極探索 “防禦性 AI” 技術, 以應對未來可能面臨的 “技術脫鉤” 風險。
“宜未雨而綢繆, 毋臨渴而掘井”。 面對風雲變幻的國際局勢, 中國 AI 產業的發展, 既要保持 “戰略自信”, 也要增強 “憂患意識”。 在 “自主創新” 的道路上, 我們既要腳踏實地, 埋頭苦幹, 也要仰望星空, 前瞻佈局, 才能在全球 AI 競爭的 “下半場”, 贏得更加主動, 也更有尊嚴。

結語
華為昇騰910C的問世,絕非一帆風順的 “王者歸來”,而更像是一場在重壓之下,展現韌性與智慧的 “突圍之戰”。 它或許並不完美,單卡效能與頂尖水平仍有差距,供應鏈來源也撲朔迷離,但它的戰略意義卻不容低估。它標誌著中國在AI晶片自主研發的道路上,又邁出了關鍵一步,也預示著在全球AI競爭格局中,中國將走出一條 “差異化競爭” 的獨特路徑。
昇騰910C 的 “故事”, 遠未結束。 我們將持續關注它的實際應用表現, 以及它對中國 AI 產業帶來的深遠影響, 併為讀者帶來更多深入、 專業的解讀與分析。 中國 AI, 未來可期, 但前路漫漫, 仍需上下求索。



免責申明:本號聚焦相關技術分享,內容觀點不代表本號立場,可追溯內容均註明來源,釋出文章若存在版權等問題,請留言聯絡刪除,謝謝。
推薦閱讀
更多架構相關技術知識總結請參考“架構師全店鋪技術資料打包(全)”相關電子書(46本技術資料打包彙總詳情可透過“閱讀原文”獲取)。
溫馨提示:
掃描二維碼關注公眾號,點選閱讀原文連結獲取“架構師技術全店資料打包彙總(全)”電子書資料詳情。

