10分鐘部署AI應用,你應該用這個

現在以大模型為代表的新一代人工智慧技術迅猛發展,展現出廣闊應用前景。
在 AI 即未來的大路上,眾多國企和上市公司紛紛接入 AI 大模型,然而對於剛開始和 AI 打交道的公司來說,通常都會遇到五個坑:
  1. 為AI 找新場景適配,而不是立足核心業務進行痛點最佳化。
  2. 對大模型的算力依賴、引數依賴,以為大模型越大、引數越多,就能越好的解決問題。
  3. 資料分散在公司各個角落,並且是各種格式,不好清洗與訓練。
  4. 大力出奇跡,只想著堆算力,沒有對業務痛點的深刻理解。
  5. 利用 AI做了一堆場景適配,不搞持續最佳化。
根據這些痛點,華為雲特地打造了MaaS大模型服務平臺,透過“三層五階十二步”的方法論為企業提供清晰、可靠的大模型落地方案。
“三層五階十二步”的方法論將大模型服務分為三層:重定義智慧業務、模型開發與交付和持續最佳化 AI應用。細分為五階段:場景識別、模型選型、模型調優、資料治理、持續運營,這五個階段內部還有十二個步驟。
可以說,MaaS平臺打通了從底層算力到上層應用的全鏈路。

具體包括:
  1. AI基礎設施:整合了鯤鵬、昇騰、X86等算力,並配套了Flexus系列雲服務,包括儲存、資料庫和雲搜尋,為上層所有 AI 開發和應用,提供穩定高效的雲服務底座和強勁的大模型推理效能。
  2. 模型廣場:相容多種開源大模型,給予客戶充分的選擇權,還提供從模型部署到模型微調的全鏈路工具,提升搭建 AI應用、接入 AI應用的效率。
  3. MCP廣場:企業的IT團隊既可以呼叫美團、通達信等精品MCP,也可以選擇上千種流行的MCP,快速構建出智慧客服、智慧問答、互動數字人等多種智慧應用,並與現有業務系統打通整合,極大的提升了應用建立的易用性。
今天就帶大家體驗一下MaaS平臺所帶來的 AI 雲基建能為我們的 AI 應用帶來多麼高效的提升。

1. 預置30+主流開源大模型

一開啟華為雲的 MaaS 大模型服務平臺,就能看到模型廣場,模型廣場內提供了市面上主流的開源大模型:

在模型廣場內你可以透過分類找到你想要的模型,但是上面的分類並不是全部,你還可以在 MaaS 平臺的模型庫中去選擇更多模型進行部署,比如 Meta 的Llama 系列和國內的百川大模型系列:

針對DeepSeek,MaaS 平臺也做了單獨的適配。
今年五月底,DeepSeek 釋出了 DeepSeek R1-0528 版本,該模型在在數學推理、程式碼生成、邏輯推理等多個核心基準測試中,展現出開源模型當前最先進(SOTA)的效能水平。華為雲MaaS快速跟進,針對該模型進行深度適配與最佳化,並推出了 DeepSeek R1-0528 的685B滿血版本。
對於同一個大模型而言,部署滿血版和裁切板,所得到的效能是截然不同的,它就類似 CPU 領域的鎖頻和超頻,只有滿血版的大模型才能發揮出這個模型的上限能力。
得益於華為雲昇騰AI雲服務的全棧最佳化與龐大的底層算力,DeepSeek滿血版在華為雲平臺上實現了高推理效率和資源利用率,不僅能夠讓企業享受最高效能,還能助力企業大幅降低推理成本。
以上這些模型,除了主流版本之外,MaaS 平臺還提供了蒸餾版本和裁切版本(比如上面截圖中的 DeepSeek-R1-32K),這樣更能滿足大中小企業的多樣化需求。
比如在網際網路推薦場景,企業可以選擇具有頂級推理能力的滿血版模型,而在辦公領域,可以選擇中等引數的模型,一切都根據企業的需求來定奪。
一般模型引數越小,價格也往往越便宜,所以對於企業來說,選擇適合自己需求的模型能夠節省更多的成本。
而為企業提供更多選擇,兼顧效能與成本,是華為雲一直努力的方向。
所以,對於需要接入 AI 的企業來說,可以先在 MaaS 平臺快速接入一箇中等引數的大模型,以較低的成本驗證業務,隨著業務驗證完成,再將模型切換為滿血版本的大模型,這一切都可以在 MaaS 平臺滑鼠點幾下完成。

2. MCP 讓大模型擴充更多能力

最近 MCP 在 AI 領域比較火。
可能有一些同學可能聽到MCP 比較陌生,它其實是大模型和其他應用之間的橋樑,比如你問大模型明天什麼天氣,那麼大模型就需要知道你在哪(透過你的地理位置獲取你的城市),透過你的城市去查詢天氣資訊(呼叫MCP廣場中的氣象服務)。
所以使用 MCP 能為你的大模型應用新增非常多的多樣能力,比如聯網、查車票、查天氣、甚至給照片修圖+美顏。
而華為雲的Maas 平臺早早就在佈局 MCP,目前在Maas 平臺的 MCP 廣場已經有 1400+ MCP應用

可以看到  MaaS平臺中的 MCP廣場匯聚了多種功能、多種行業的 MCP 服務,其中不乏天眼通、高德地圖、美圖影像這種國民級應用的入駐。
而透過 MCP 廣場中提供的這些能力,我們可以輕鬆讓自己的大模型接入這些能力。
比如你可以使用美圖公司的 MCP 做一個照片美化器的應用,只需要在Maas 平臺建立模型時新增美圖影像這個 MCP 即可:

如上圖所示,我們先選擇一個 DeepSeek模型,再新增美圖影像這個 MCP,接著輸入一些提示詞後,點選建立應用,你就可以得到一個滿血 DeepSeek + MCP 的線上大模型服務了。
接著你就可以在任何平臺,以 HTTP API 的方式接入此模型服務,由於此服務具備了美圖影像的能力,你可以在一些場景下提示使用者上傳照片,利用大模型的能力對照片進行美顏,然後再返回給使用者展示。
再比如你希望在你的 AI 應用場景中,加入搜尋功能,那你可以在建立模型時新增聯網增強這個 MCP,這樣你的模型就具備了聯網功能,可能快速根據最新的資訊做出決策。
如果你要做 toB 的大模型應用,那天眼通這個 MCP 也大機率要接入了,它可以為你查詢企業的相關情況,對於一些智慧問答企業情況的場景比較好用。
還有許許多多,各種能力的 MCP,你都可以在 MaaS 平臺的 MCP 廣場去尋找並使用。

3. 軟硬體協同打造延遲與高效能

前文中介紹了一些 MaaS 平臺中模型和生態,但是對於接入大模型的企業來說,除了生態,大模型的效能表現更是使用者更能切身感知到的使用者體驗。
大模型的效能其實表現在兩方面,一是高吞吐量:可以承載更多的使用者,二是低延時:可以讓使用者以極快的速度得到回覆。
比如大模型普遍應用的行程旅遊規劃場景,接入方大部分都是網際網路旅遊平臺,他們擁有著海量使用者,所以對於模型的吞吐量要求極高,不能讓客戶感覺到卡頓,同時也會對回覆速度有要求,速度越快,轉化率可能就越高。
這種要求對 MaaS 這種雲端大模型平臺帶來了:算力、吞吐量、延時的三重要求。
所以華為雲 MaaS 平臺為了解決這三個問題,透過系統級協同創新,以架構實現提升,並透過:超節點、推理框架和模型閘道器進行三重最佳化。
首先是A3 超節點以 384個計算卡形成高速互聯,突破傳統叢集頻寬/視訊記憶體瓶頸,使跨機通訊時延降低,為超大模型混合並行提供硬體級競爭力。CloudMatrix384超節點首創將384顆昇騰NPU和192顆鯤鵬CPU透過全新高速網路MatrixLink全對等互聯,形成一臺超級“AI伺服器”,單卡推理吞吐量躍升到2300 Tokens/s。
同時支援混合專家MoE大模型的推理,以“1卡1專家”架構提升推理效率,支撐 DeepSeek 等千億引數模型推理效能 3 倍躍升
其次是大EP推理框架,這是華為雲專為昇騰最佳化的推理框架,透過大規模“專家並行”(EP)技術,把模型推理任務分配到眾多計算卡上,以此實現每張卡載入小塊推理人物,在關鍵的解碼階段響應更快,實現了整體上的超低延遲,資源利用率提升20%,效能提升10%+ 。
由於推理任務被分散開來,單計算卡能夠預留更多視訊記憶體容量,預留容量用於KV快取,既能支援更大使用者併發所需的KV快取,支援更長的上下文序列,又能實現系統的更大吞吐效能,同時透過大規模專家並行+PD分離+投機推理,實現了3倍單卡吞吐效能
最後則是模型閘道器為客戶提供支援跨地域就近接入,減少網路傳輸距離,降低使用者側延遲,讓客戶能夠第一時間享受到即開即用的AI算力資源。
華為雲還透過 Prompt 長度感知,將長文字請求定向排程至高視訊記憶體例項,短文字分配至低延遲例項,動態合併空閒算力形成“公共資源池”,提升叢集利用率。
有了以上這些開創式的更新,MaaS 平臺完全能夠同時滿足海量算力、高吞吐量和低延時的要求,比如一些頭部企業的高併發業務需求。

4. 以模護模為應用打造安全航母

除了效能要求之外,AI大模型安全更是平臺的重中之重,其安全性已遠超傳統網路安全的範疇,成為決定業務成敗的基石。
真正的安全,不僅在於抵禦外部攻擊,更在於構建一個從底層硬體到上層應用都穩定、透明、可控的“信任環境”。
若無此保障,再強大的算力也可能因硬體故障而中斷,再智慧的模型也無法提供持續可靠的服務。
華為雲提供包含語料資料安全、模型安全、推理安全、應用安全在內的全生命週期模型安全方案,真正做到了堅如磐石的雲安全。
華為雲重磅釋出大模型防火牆,透過提示詞攻擊防範和敏感內容即時檢測,保障大模型推理安全。一方面識別越獄、角色扮演、惡意指令等主流提示詞攻擊手段;另一方面預置了百萬級規則庫,針對提示詞攻擊的檢出率大於 95%,整體能夠幫助模型綜合安全評測得分提升 20% 以上。
此外,MaaS 還透過 “以模護模”的功能進行二次安全驗證,凡是在MaaS中涉及安全能力判斷的場景,都會由信通院認證評估安全可信滿級評分(業界最高分)的ModelArts Guard大模型安全護欄進行內容稽核,非法敏感內容攔截率達90%+。
以上種種,令華為雲的安全與運維服務成為了 MaaS 平臺為企業做好安全運維保障的重要基石。

總結

華為雲MaaS 平臺從算力到應用,提供了端到端的整體產品能力,並且透過按需使用的彈性算力,有效幫助企業控制算力成本,是開發者部署大模型的優先選擇。
大家可以透過華為雲 MaaS 平臺官網進行詳細瞭解~

相關文章