
由大模型激盪起的人工智慧(AI)浪潮,正持續不斷地衝擊著企業應用這座大壩。2025年初,DeepSeek的橫空出世,只是微微抬起了沉重的閘門而已。不斷積蓄的AI勢能,何時才能一瀉千里,快速轉化為動能,驅動千行百業的數智化轉型,使其享受到新質生產力帶來的變革紅利呢?
阿里雲4月9日舉辦的AI勢能大會,是一場超然的誓師大會。發力全棧智慧的阿里雲,讓AI+的夢想更快地照進了企業應用的現實。
天時地利人和
2025是中國AI應用爆發元年
2025年的央視春晚,讓很多人第一次“AI”上了這道中國人不可或缺的年夜大餐。其實,熱熱鬧鬧的機器人秧歌隊只是冰山一角,更多AI帶來的震撼、感動、驚喜,是透過阿里雲這個底座,傳遍了五湖四海。

阿里雲智慧集團資深副總裁、公共雲事業部總裁
劉偉光
AI的演進“未來已來”,而企業的業務需求“過去未去”。如何讓AI技術與企業的業務適配融合?阿里雲智慧集團資深副總裁、公共雲事業部總裁劉偉光指出,大模型的社會價值正在企業市場中釋放,阿里雲將堅定投入,打造全棧領先的技術,並且持續開源開放,為AI應用提速。
今天,AI大模型在企業中落地,擁有天時、地利、人和。
從AI自身的發展來看,2024年在全球範圍內,基礎模型能力的大幅提升有目共睹,尤其是在中國,從深度推理模型到多模態的能力都有了顯著提升,並在很多產業催生了強化學習新的想法,讓更多AI應用落地的可能性越來越高。令人感到欣喜的是,AI訓練和推理所需的資源成本持續降低,AI普惠程序不斷加速。
從產業推動來看,各行各業尤其是雲計算企業、AI創業企業等都在進行大力投入。以阿里云為例,不久前剛宣佈未來將投入3800億元,用於人工智慧和基礎設施建設。另外,大模型在開源生態建設方面有了很大進展。作為加速引擎,開源技術與標準化將大大簡化模型的呼叫,促進AI應用的生態繁榮。
從整個社會層面看,從國家到地方政府都極其重視人工智慧+的深入發展。今年全國兩會政府工作報告中提出,持續推進“人工智慧+”行動,將數字技術與製造優勢、市場優勢更好結合起來,支援大模型廣泛應用。此外,DeepSeek在全球“出圈”,讓普通民眾對大語言模型能力的認知水平有了顯著提升,這在某種程度上推動了各類企業積極嘗試在AI Agent、AI原生應用,以及推理應用等方面進行創新和探索。
“我非常有理由堅信,2025年一定是中國AI應用爆發的元年。”劉偉光如是說。
模型、推理基礎設施、開發工具
一個也不能少
AI應用的爆發對模型的效能、模型之下的基礎設施,以及支撐AI應用的開發工具都提出了更高要求。阿里雲正是從這三方面要素出發,進行最佳化和體系升級,從而為AI應用開發提速。

1. 基礎模型:沒有最強只有更強
基礎模型是整個AI應用生態中最核心的引擎,它透過提供深度的推理能力、多模態理解和互動能力,支援多樣化、高質量服務,並且基於很多不同型別、尺寸的模型,滿足複雜、輕型和更多探索型需求。
阿里雲是開源模型的積極貢獻者。通義大模型是中國最早的基礎大模型家族,在國內外擁有龐大的使用者基礎。自2023年釋出以來,阿里雲持續快速迭代通義大模型,尤其是最近5個月中,迭代更加密集。同時,阿里雲也以更快的速度開源更多不同型別的模型。
今天,阿里雲已經成為全球唯一一家積極研發基礎大模型,並全方位開源、全方位貢獻的雲計算廠商,其開源模型總數超過200款。阿里雲將優秀的、更多尺寸的模型開源之後,獲得了更廣泛的開發者和企業級使用者的支援及反饋,從而驗證了阿里雲每一款開源模型的可行性和正確性。
劉偉光表示,大模型未來的發展有兩個關鍵點:一個是Reasoning推理,另一個是Omin全模態融合。
就在2025年3月,阿里雲開源了通義千問QwQ-32B推理模型,它在數字程式碼和通用能力上實現了重要突破,尤其在小引數實現大引數模型的Sora能力上,展示出極高水準,並且對Agent智慧體更加友好。
未來,大模型一定會朝著更強的推理能力進化。伴隨著模型內生的任務規劃、工具使用能力不斷增強,大模型會越來越智慧,不斷思考更難的問題,完成更復雜的任務。這也是阿里雲努力的方向。
“強化學習是一個新趨勢。很多客戶都在利用更為強大的基礎大模型做基於強化學習的後訓練,而強化學習後訓練反過來又為推理提供了重要的能力補充。”劉偉光表示,“未來,將有更多客戶基於強化學習後訓練,以及更加強大的基礎模型開發出更多嶄新的、更具價值的AI原生應用和AI Agent。”
Omin全模態融合意味著音訊、影片、文字等全模態的融合,這將跨越模態的界限,並且整合不同型別的要素,為解決複雜問題提供強有力的支撐,同時激發新的可能性。3月27日,阿里雲釋出了首個端到端全模態大模型通義千問Qwen2.5-Omni-7B,其最大的特點就是可同時處理文字、影像、音訊、影片等多種輸入,並可即時地生成文字與自然語言,進行合成輸出。Omin全模態融合未來的目標是讓模型像人一樣識別影像、文字,更好地理解意圖、影片、聲音等,從而創造出更多新的商業模式。
在新一代分散式核心系統上線後,中華財險已從數字化走向數智化的升級。通義靈碼助力60%的研發人員使用AI程式設計,程式碼採用率達37.5%(累計53萬行)。基於通義大模型,條款解讀助手和智慧理賠助手為保險產品全流程智慧化奠定基礎,重塑了行業效率標杆。
2. 推理服務基礎設施:全方位最佳化與保障
企業在探索大語言模型落地應用的過程中發現,起到重要支撐作用的基礎設施能力,特別是推理服務能力是不可或缺的,它能夠確保AI應用服務的平滑、穩定、高效。劉偉光表示:“今天,我們看到雲計算也在慢慢地為AI而改變,無論是計算、儲存還是網路,都為AI做了非常多的最佳化,旨在讓所有的AI訓練、推理和應用都能在雲基礎設施上更穩定、平滑、高效地執行。”
我們來看幾個例子。隨著模型的引數量持續擴大,模型的冷啟動與規模化擴容成為新的瓶頸,給儲存、網路帶來了巨大壓力。為此,阿里雲推出了全新的模型權重服務,將大模型從0—100節點冷啟動的速度提升21倍,將50—100節點的擴容速度提升12倍。
針對MOE的最佳化,阿里雲推出了分散式推理排程引擎Llumnix,提高了叢集的資源利用率,降低了推理延遲,使得第一個首Token延遲下降92%,同時每一個Token生成時間縮短15%。
另外,阿里雲還實現了流量感知的PD分離,即預填充與解碼的分離,從而實現了高效能的KV儲存,透過技術最佳化,端到端的服務吞吐提升近91%,這意味著在千萬級的活躍使用者場景中,KV Cache命中率能夠提升10倍。
3.開發工具:降低AI門檻
當模型的能力足夠強大,且AI應用遍地開花的時候,使用者更加迫切需要完備的工具鏈,以簡化AI應用的開發。“開發工具是連通大語言模型與真實應用最重要的橋樑。”劉偉光表示,“企業使用者需要功能齊全、生態豐富、靈活部署的工具,以降低AI應用的門檻。”
阿里雲在百鍊平臺上不斷進行最佳化,提供了全鏈路應用構建工具,這相當於為企業AI應用開發者提供了“最後一公里”的技術保障。這些工具主要包括:記憶類工具,為客戶提供高效智慧的上下文管理,解決碎片化問題,提供個性化的長期記憶,以提升模型的推理效率;RAG工具,這一檢索增強工具可以支援文字、表格、圖片等跨模態的融合搜尋,提升了搜尋的精準度;模型的路由工具,在複雜的工作流程中,可以根據客戶任務需求自動進行排程的智慧化;工作流編排工具,可透過拖拉拽的方式實現多種智慧體之間的混合編排,提供企業級的SLA保障;工具呼叫能力,可以幫助企業使用者在5—10分鐘內構建起智慧體,並灌入企業的資料和業務邏輯,同時提供豐富的外掛;全鏈路的觀測能力,讓企業在一個生命週期內能看到所有的AI Agent、AI應用的運轉情況以及使用效果。

堅定投入、全棧創新、開源開放
推動AI普惠和規模化應用
阿里雲致力於打造全棧AI,不僅覆蓋大模型、雲下的技術架構層,還包含底層的異構算力、模型服務平臺、百鍊平臺,以及所有客戶服務。在基礎設施與資料服務領域,阿里雲已經耕耘多年,並頗有建樹。未來,阿里雲將重點在開發構建層和應用生態層發力,不斷加大投入,讓AI和雲更好融合,為客戶提供更加高效的AI基礎設施。
談到未來的發展方向,劉偉光強調了兩點。由於新的模型層出不窮,開發構建層大語言模型和外部工具互動是非常重要的一環。使用者需要一座打通應用的橋樑。MCP是公認的業界標準,有望加速AI應用爆發的最後一公里的連線。從4月9日開始,阿里雲將在百鍊上全面支援MCP服務部署和呼叫。透過阿里雲提供的業界首個全生命週期MCP服務,無需使用者管理資源、開發部署、工程運維等工作,5分鐘即可快速搭建一個專屬MCP Agent,從而大幅降低Agent的開發門檻。百鍊平臺首批上線了高德、無影、Fetch、Notion等50多款阿里巴巴集團和第三方MCP服務,覆蓋生活資訊、瀏覽器、資訊處理、內容生成等領域,可滿足不同場景的Agent應用開發需求。
AI Agent已經開始走入尋常百姓家。劉偉光表示,2025將是AI Agent爆發的一年,未來AI Agent會以各種各樣的形態存在於手機、終端、電腦和各種各樣的新型裝置中。為了提供更高質量、更便利的AI Agent開發工具環境平臺,開闢新市場,阿里雲的AI Agent Store將開啟AI生態的“繁星閣”,推動企業進入人機協同的新時代,幫助客戶更快、更高效地開發Agent。為此,阿里巴巴將從自身做起,首先將阿里巴巴旗下的所有服務都開放在AI Agent Store上,無論開發者、內容創作者還是行業解決方案提供商,均可以在AI Agent Store上貢獻智慧,共享成果,並不斷迭代開發應用。
堅定投入、全棧創新、開源開放,阿里巴巴將AI作為其核心戰略,致力於推動AI的普及、普惠與規模化應用。
