
作者 | 吳優
編輯 | 李帥飛
“什麼是最偉大的?”
“最偉大的是那些善待他人的人。”
在英偉達 GTC 2021 大會上,黃仁勳的開幕演講以一段極具哲學性和未來感的對話畫上句號。
回答者不是黃仁勳本人,而是以黃仁勳為原型的對話式虛擬形象——Toy Jensen。黃仁勳在開幕演講中介紹,這一虛擬形象是基於目前訓練的最大自然語言處理模型和光線追蹤的精美影像而合成即時形象。
“有了最近才實現的一些驚人技術,Toy-me 得以打造而成,而這些技術在以前看來幾乎都是不可能實現的。”
Toy Jensen 的呈現,透露了英偉達的元宇宙願景,此外,按照慣例,英偉達還在此次GTC上推出了一系列AI技術與產品:
目前為止最先進的端到端的網路平臺 Quantum-2,多節點分散式推理功能的 NVIDIA Triton 推理伺服器,NVIDIA A2 Tensor Core GPU加速器,全球最小、功能最強大、能效最高的下一代超級計算機NVIDIA Jetson AGX Orin 等系列產品等等。
1
Omniverse 更新升級,加速 2D
網際網路向 3D 演變
在去年的 GTC 大會上,英偉達宣佈推出 Omniverse,並介紹其為世界上第一個基於英偉達 RTX 的三維模擬和協作平臺,融合了物理和虛擬世界,即時模擬現實並具有真實感的細節,無論是藝術家還是人工智慧,都能夠在不同世界使用不同的工具,共同創造一個全新的世界。

經歷近一年的發展,已經有 70000 多名創作者下載,500 多家公司的專業人士使用 Omniverse 公測版,寶馬集團、CannonDesign、Epigraph、Ericsson、建築公司 HKS 和 KPF、Lockheed Martin 以及 Sony Pictures Animation 都包括在內。
其中,Ericsson 正在使用 Omniverse 平臺建立數字孿生,模擬和視覺化訊號傳播,以加速 5G 網路的功能開發和洞察。
與此同時,Omniverse 本身也隨之更新升級。
Omniverse Avatar 是英偉達推出的一個能夠用於生成互動式 AI 虛擬化身的技術平臺,連線英偉達語音 AI、計算機視覺、自然語言理解、推薦引擎和模擬方面技術,即將 Metropolis 的感知能力、Riva 的語音識別能力、Merlin 的推薦能力、Omniverse 的動畫渲染能力等交匯於一體。
其中,NVIDIA Riva 語音 AI 軟體新增了一項 Riva 定製語音功能,只需要 30 分鐘的音訊資料,就能在一天之內打造類似真人的定製語音,幾乎類似於科幻愛情電影《她》中的薩曼莎,擁有斯嘉麗的迷人聲線,且擁有超強的學習能力。
落地到具體應用中,企業可以使用 Riva 定製語音打造專屬語音的虛擬助理,開發具有辨識度的品牌語音,開發者也可以藉助其建立各種各樣的應用程式,為有語言障礙的人提供支援。
基於 Omniverse Avatar 這一平臺,原本處於 2D 狀態的虛擬助手就有能力變成一個擁有常識、推理能力和生動的 3D 視覺形象,理解多種語言,且在同人類的交流中給出更加智慧的回答。正如在直播中看到的那樣,當英偉達的 3 位工作人員分別向 Toy Jensen 提出有關氣候變化、天文學以及生物蛋白質等棘手的問題時,這個小傢伙都能對答如流。
再者,英偉達演示了基於對話操作檯 Tokkio 基於 Omniverse Avatar 平臺的應用程式,當餐廳有兩位顧客同時點餐時,客戶服務的虛擬化身能夠同顧客進行眼神交流,並根據兩位顧客的用餐需求給出推薦選單。
而 Omniverse 本身,也更新了4大功能,包括 Showroom、Farm、AR和VR。

其中,Showroom 作為 Omniverse 公測版中的應用程式提供,允許非技術使用者使用 Omniverse 技術演示,展示平臺的即時物理和渲染技術;
Farm 允許團隊同時使用多個工作站或伺服器,為渲染、合成數據生成或檔案轉換等任務提供支援;
VR 推出領先的完全影像、光線追蹤 VR,支援開發者在平臺上構建自己的 VR 功能,終端使用者可以直接享受 VR 功能;AR 同理。
另外,英偉達還宣佈 Omniverse Enterprise 已進入正式釋出階段。它允許跨多個軟體套件工作的全球 3D 設計團隊在共享虛擬空間中透過任意裝置即時協作。Omniverse 的生態系統正在不斷擴充套件。
2
最新 Triton 推理伺服器,助力即時
大型語言模型開發與部署
構建交流如此自如的 Toy Jensen,同樣離不開強大的自然語言處理模型,其背後的技術邏輯也在此次大會上得以展現。
英偉達推出了為訓練具有數萬億引數的語言模型而最佳化的 NVIDIA NeMo Megatron 框架,為新領域和語言進行訓練的可定製大型語言模型(LLM)Megatron 530B 以及具有多 GPU、多節點分散式推理能力的 NVIDIA Triton 推理伺服器。
而基於這些工具,不僅僅能構建 Toy Jensen,企業也可以建立自己的、特定領域的聊天機器人、個人助理以及其他 AI 應用程式,高水平理解語言中細微的差別。
NVIDIA NeMo Megatron 是在 Megatron 的基礎上發展起來的開源專案,由 NVIDIA 研究人員主導,研究大型轉換語言模型的高效訓練。Megatron 530B 是世界上最大的可定製語言模型。

NeMo Megatron 框架經過最佳化,可以在 NVIDIA DGX SuperPOD 的大規模加速計算基礎設施上進行擴充套件。
有了大型語音模型,如何儲存和執行呢?尤其是這些模型對記憶體的需求極大,超過單個 GPU 甚至是多個GPU 伺服器所能夠提供給的記憶體,且在實際應用中對推理即時性要求較高。
NVIDIA Triton 推理伺服器的出現解決這一問題,英偉達在此次大會上釋出的最新 NVIDIA Triton 具有多 GPU、多節點特性,使大型語言模型推理工作負載能夠即時在多個 GPU 和節點上擴充套件。

藉助 Triton 推理伺服器,Megatron 530B 能在兩個 NVIDIA DGX 系統上執行,將處理時間從 CPU 伺服器上的 1 分鐘以上縮短到 0.5 秒,令即時部署部署大型語言模型成為可能。
事實上已經有不少企業在使用 NVIDIA DGX SuperPOD 構建大型複雜語言模型,SiDi、京東探索研究院和VinBrai都包括在內。
3
其他AI新進展:Quantum-2
和 Jentson AGX Orin
展望元宇宙的英偉達,在其他產品線方面也保持著持續更新。
首先是推出了可進行雲原生超級計算的 Quantum-2 平臺,即 400Gbps 的 InfiniBand 網路平臺,包括 NVIDIA Quantum-2 交換機、ConnectX-7 網絡卡、BlueField-3 資料處理器 DPU(資料處理器)和所有支援這種新架構的軟體。這也是迄今為止最先進的端到端網路平臺。ConnectX-7 將於明年1月問世。

其中,Quantum-2 InfiniBand 交換機基於新的 Quantum-2 ASIC,採用臺積電 7nm 節點,包含 570 億個電晶體,超過有 540 億電晶體的 A100 GPU。
Quantum-2 InfiniBand 擁有 400Gbps 的高吞吐量,將網路速度提高 1 倍,網路埠數量增加了 3 倍。它在效能提升 3 倍的同時,還將對資料中心網路所需的交換機數量減少了 6 倍,於此同時,資料中心的能耗和空間各減少了 7%。
另外,全球最小、功能強大、能效最高的新一代 AI 超級計算機 NVIDIA Jetson AGX Orin,算力高達 200TOPS ,用於機器人、自主機器、醫療器械和其他形式的邊緣嵌入式計算。
Jetson AGX Orin 基於 NVIDIA Ampere 架構,與其前身 Jetson AGX Xavier 保持外形和引腳相容性一直,不過處理能力擴大至 6 倍,每秒可提供 200 萬億次操作,它類似於支援 GPU 的伺服器,但大小僅相當於人的手掌。
新的 Jetson 計算機可加速完整的 NVIDIA AI 軟體棧,使開發人員能夠部署最大、最複雜的模型,以解決自然語言理解、3D 感知、多感測器融合等邊緣 AI 和機器人任務。
4
小結
上週,英偉達市值突破7000億美元,不少分析師稱其市值上漲的背後,是元宇宙在助力,此次GT C大會上表現也確實證明,英偉達以其Omniverse平臺為基礎,構建了一個元宇宙願景。
不過,不要忘了,英偉達依然是一家在AI和高效能計算領域有深厚積累的科技公司,除了火熱的元宇宙外,此次大會期間,也將有更多有關加速計算、深度學習領域的內容呈現。
推薦閱讀
道的投資人:做局失利、破局無力

關鍵詞
英偉達
黃仁勳
平臺
元宇宙
伺服器