人工智慧熱潮催生了算力服務

點選藍字 關注我們
SUBSCRIBE to US
Alamy
對人工智慧興趣的激增正在產生對計算能力的巨大需求。在全球範圍內,企業都在努力滿足為越來越先進的人工智慧模型提供動力所需的大量圖形處理器(GPU)。雖然GPU不是執行人工智慧模型的唯一選擇,但由於它們能夠高效地同時處理多項操作——這是開發深度學習模型時的一個關鍵特性,它們已成為首選硬體(https://spectrum.ieee.org/ai-chip-sambanova)。
但並非每個人工智慧初創企業都有資金投資如今執行前沿模型所需的大量GPU。對一些企業來說,外包是更好的選擇。這就催生了一項新業務:GPU-as-a-Service(GPUaaS,算力服務)。近年來,像Hyperbolic、Kinesis、Runpod和Vast.ai這樣的公司紛紛湧現,為客戶遠端提供所需的處理能力。
雖然像亞馬遜或微軟這樣提供雲計算服務的科技巨頭擁有自己的基礎設施,但像Kinesis這樣較小的初創企業已經創造出一些技術來充分利用現有的閒置算力。
“企業需要算力。他們需要模型得到訓練,或者讓他們的應用程式得以執行;他們不一定需要擁有或管理伺服器,”Kinesis的聯合創始人Bina Khimani說道。
研究表明,在任何特定時間,現有超過一半的GPU都處於未使用狀態(https://dl.acm.org/doi/10.1145/3597503.3639232)。不管我們說的是個人電腦還是大型伺服器群,很多處理能力都沒有得到充分利用。Kinesis所做的就是識別全球伺服器中GPU和CPU(中央處理器)的閒置算力,並將它們整合為一個單一的計算資源供企業使用。Kinesis與願意出售其閒置計算能力的大學、資料中心、企業和個人開展合作。透過安裝在他們伺服器上的一種特殊軟體,Kinesis檢測閒置處理單元,對其進行準備工作,然後將它們提供給客戶臨時使用。
Khimani說:“在Kinesis公司,我們已經開發出相關技術,能將分散的閒置算力彙集起來,然後將其重新用於一個無伺服器、自動管理的計算平臺。”Kinesis的客戶甚至可以選擇他們所需的GPU或CPU的來源。
人工智慧的發展速度超過了伺服器的跟進速度
GPUaaS正在填補人工智慧行業中日益擴大的缺口。隨著學習模型變得更加複雜,它們需要更多的算力以及能夠越來越快地處理資訊的基礎設施。換句話說,如果沒有足夠數量的GPU,大型人工智慧模型就無法執行——更不用說改進了。10月,OpenAI的執行長Sam Altman承認,公司釋出產品的頻率沒有達到他們的期望,因為他們在計算能力方面面臨“諸多限制”(https://techcrunch.com/2024/10/31/openai-ceo-sam-altman-says-lack-of-compute-is-delaying-the-companys-products/)。
同樣在10月,微軟的首席財務官Amy Woods在一次電話會議中告知公司的投資者,對人工智慧的需求“持續高於”他們的“可用產能”(https://www.microsoft.com/en-us/Investor/events/FY-2025/earnings-fy-2025-q1)。
GPUaaS最大的優勢在於經濟實惠。由於無需購買和維護物理基礎設施,這使得企業能夠避免在伺服器和資訊科技(IT)管理方面進行投資,轉而將資源用於改進自身的深度學習、大語言和大視覺模型。它還能讓客戶按照使用GPU的實際數量付費,從而節省自身伺服器必然會產生的閒置算力成本。
像Kinesis這樣的無伺服器初創企業還聲稱,與傳統雲計算公司相比,它們對環境更友好。他們表示,透過利用現有的閒置處理單元而非為額外的伺服器供電,能夠顯著降低能耗。在過去五年中,由於人工智慧消耗大量能源,谷歌和微軟等大型科技公司的碳排放量飆升。作為回應,一些公司已經將目光投向核能,以便為其伺服器可持續供電。Kinesis和其他新興初創企業提供了第三條路線,即無需再接入更多伺服器。
“行業領導者們堅定致力於可持續發展,”Khimani說道,“著眼於創新和效率,他們能夠最佳化那些已經在執行且消耗能量的現有計算能力,而不必為執行的每個新應用不斷增加更多伺服器。”
對機器學習日益增長的需求以及海量的資料消耗正在使GPUaaS成為一個非常有利可圖的科技領域。2023年,該行業的市場規模估值為32.3億美元;2024年,增長到43.1億美元。預計到2032年將增長到498.4億美元(https://www.fortunebusinessinsights.com/gpu-as-a-service-market-107797)。
“人工智慧行業正在迅速邁向一個新階段,重點正從僅僅構建和訓練模型轉向最佳化效率,”Khimani說,“客戶越來越多地提出這樣的問題:‘在訓練一個新模型時,我們如何能做到極具針對性,而不消耗大量需要鉅額算力和能源的資料呢?’”
微訊號|IEEE電氣電子工程師學會
新浪微博|IEEE中國
 · IEEE電氣電子工程師學會 · 

相關文章