開源專案推動下，CUDA將相容非NvidiaGPU？

公眾號記得加星標⭐️，第一時間看推送不會錯過。

來源：內容編譯自techspot。

CUDA 與 AMD 和 Intel GPU 的相容性不再是夢想。

Nvidia 於 2006 年推出 CUDA，作為專有 API 和軟體層，最終成為釋放 GPU 巨大平行計算能力的關鍵。CUDA 在人工智慧、科學計算和高效能模擬等領域發揮著重要作用。但 CUDA 程式碼的執行在很大程度上仍然受限於 Nvidia 硬體。現在，一個開源專案正在努力打破這一障礙。

透過使 CUDA 應用程式能夠在 AMD、英特爾和其他公司的第三方 GPU 上執行，這一努力可以大大擴充套件硬體選擇，減少供應商鎖定，並使強大的 GPU 計算比以往更容易獲得。

Zluda 團隊最近釋出了最新的季度更新，確認該專案仍致力於在非 Nvidia 圖形加速器上全面實現 CUDA 相容性。Zluda 的目標是在 AMD、Intel 和其他 GPU 架構上提供 CUDA 的直接替代方案，讓使用者和開發者能夠以“接近原生”的效能執行未經修改的基於 CUDA 的應用程式。

Zluda 最令人欣喜的變化是其團隊規模擴大了一倍。目前有兩名全職開發人員在負責該專案。新加入的開發人員名為“Violet”，她已經為該工具在GitHub上的官方開源倉庫做出了突出貢獻。

其他重要更新包括對 ROCm/HIP GPU 執行時的改進，現在該執行時應該能夠在 Linux 和 Windows 上可靠執行。CUDA 和 ROCm 等 GPU 執行時旨在在執行時編譯 GPU 程式碼，從而確保為舊硬體開發的程式碼通常可以在較新的 GPU 架構上編譯和執行，並且問題最少。

Zluda 現在在非 Nvidia GPU 上執行未修改的 CUDA 二進位制檔案的效能也顯著提升。之前，該工具要麼忽略某些指令修飾符，要麼無法以完全精度執行它們。現在，改進後的程式碼可以處理一些最棘手的情況，例如 cvt 指令，並達到位精度。

全面支援 CUDA 應用程式的關鍵一步是透過詳細的日誌記錄來追蹤程式碼與 API 的互動方式。Zluda 在這方面也得到了改進。它現在可以捕獲之前被忽略的互動，甚至可以處理中間的 API 呼叫。

開發人員在支援 llm.c方面也取得了重大進展。llm.c 是一個純 CUDA 測試實現（用 C 語言編寫），適用於 GPT-2 和 GPT-3 等語言模型。Zluda 目前已在 llm.c 中實現了 44 個函式中的 16 個，團隊希望很快就能全面執行該測試。

最後，Zluda 在對 32 位 PhysX 程式碼的潛在支援方面略有進步。Nvidia 在基於 Blackwell 架構的 GeForce 50 系列 GPU 上同時放棄了對該中介軟體的硬體和軟體支援，這給老遊戲的粉絲們帶來了本質上可以說是糟糕或低劣的體驗。

上個季度，Zluda 收到了與 32 位 PhysX 支援相關的小更新。最初的重點是高效收集 CUDA 日誌以識別潛在錯誤，這些錯誤最終也可能影響 64 位 PhysX 程式碼。然而，開發人員提醒稱，完整的 32 位 PhysX 支援可能需要第三方開發人員的大量貢獻。

參考連結

https://www.techspot.com/news/108557-open-source-project-making-strides-bringing-cuda-non.html

*免責宣告：本文由作者原創。文章內容系作者個人觀點，半導體行業觀察轉載僅為了傳達一種不同的觀點，不代表半導體行業觀察對該觀點贊同或支援，如果有任何異議，歡迎聯絡半導體行業觀察。

END

今天是《半導體行業觀察》為您分享的第4086期內容，歡迎關注。

推薦閱讀

★外媒：美國將提議禁止中國製造的汽車軟體和硬體

加星標⭐️第一時間看推送，小號防走丟

求點贊

求分享

求推薦

dignews.cc

開源專案推動下，CUDA將相容非NvidiaGPU？

相關文章

GPU程式設計“改朝換代”：英偉達終為CUDA新增原生Python支援，百萬使用者變千萬？

一文講清NvidiaGPU和阿里雲GPU異構機型

DeepSeekV3論文細節：如何繞開CUDA的壟斷！

DeepSeek繞開CUDA壟斷，V3論文細節再挖出！英偉達護城河不存在了？

如何打破CUDA壟斷？LLVM奠基人長文解讀

全球AI系統級計算平臺對比：CUDA、CANN、Neuware和ROCm

GPU是如何進行算力管理的？

黃仁勳被實習生說服用CUDA，但遭團隊嫌棄？！英偉達早期架構師首次曝光：12人團隊如何開啟“算力帝國”

12人小團隊如何成就英偉達萬億市值？CUDA架構師首次親述真正的算力“壁壘”形成過程

網上關於DeepSeek的說法，哪些是錯誤的？