近日,得一微電子(YEESTOR)釋出整合AI-MemoryX技術的視訊記憶體擴充套件解決方案。該方案依託自研儲存控制晶片和AI儲存系統級創新,顯著提升單機的視訊記憶體容量,讓32B、70B、110B、671B等DeepSeek系列大模型實現單機微調訓練,為AI大模型的微調訓練提供功能強大且經濟實惠的解決方案。

得一微電子及相關合作夥伴將提供完整的微調訓練機解決方案,助力眾多行業拓展智慧應用邊界,在產業競爭中佔據先機。
低成本實現視訊記憶體擴充套件,
解鎖百倍大模型微調訓練提升
訓練和推理對GPU視訊記憶體的需求存在顯著差異。對於同一尺寸的模型,訓練所需的視訊記憶體通常是推理的20倍以上。目前市場上,訓推一體機在支援大模型微調訓練方面仍面臨視訊記憶體容量的挑戰,通常只能支援7B、14B等大模型的微調訓練,難以支援110B、70B、32B等更大模型的微調訓練。
得一微釋出的AI-MemoryX視訊記憶體擴充套件卡,將促進訓推一體機能夠支援超大尺寸大模型的微調訓練,幫助客戶支援高達110B(甚至671B)規模的訓練任務。同時,AI-MemoryX技術將原本需耗費數百上千萬的硬體擴充成本,降低至數萬元級別,大幅降低了超大模型訓練的門檻。這將使得更多企業甚至個人都能夠以有限的資源,高效開展大規模模型的訓練與微調。
高效解決視訊記憶體瓶頸,
開啟單機微調訓練新方式
視訊記憶體不足,一直是單機微調訓練超大模型的最大障礙。當下受GPU技術以及商業模式的限制,單張GPU視訊記憶體容量極為有限,中端顯示卡的視訊記憶體容量大多在48GB到64GB之間。以DeepSeek 70B模型為例,微調訓練所需的視訊記憶體高達1TB到2TB,這意味著需要動用30多張顯示卡;而對於DeepSeek 671B模型,更是需要達到10TB到20TB的視訊記憶體,對應300多張顯示卡。如此龐大的硬體需求,不僅成本高昂,還使得部署極為複雜,嚴重阻礙了大模型單機微調的普及。
得一微電子的AI-MemoryX技術透過其創新性的視訊記憶體擴充套件方案,使單機視訊記憶體容量從傳統顯示卡的幾十GB提升到10TB級別,大幅降低了微調訓練對GPU數量的需求。得益於此,DeepSeek不同尺寸的大模型(如32B、70B、110B、671B等)僅需1到16張顯示卡,配合視訊記憶體擴充套件技術,即可高效完成單機訓練微調。該技術為大模型在各行業的應用推廣提供了有力支援。

得一微電子推出的 AI-MemoryX 解決方案,是一個完整的微調訓練機方案,涵蓋大模型訓練框架、視訊記憶體擴充套件卡軟體棧以及視訊記憶體擴充套件卡X200系列,為大模型微調訓練提供全方位的技術支援與賦能。
得一微AI-MemoryX技術特色,
發掘微調的潛力和價值
監督微調SFT:小樣本撬動大效能
華裔科學家、“AI教母”李飛飛團隊等研究人員,僅用1000個樣本對模型進行監督微調,並創新性地提出預算強制(budget forcing)技術,讓s1-32B模型在多個基準測試中超越閉源模型OpenAI o1-preview,成為目前樣本效率極高的推理模型。
s1-32B模型並非從零構建,而是基於預訓練模型(阿里通義千問 Qwen2.5-32B – Instruct)進行監督微調。這一成果表明,當模型知識基礎足夠紮實時,少量高質量示例即可透過推理鏈啟用其潛在推理能力,無需依賴海量資料,高效且實用。
思維鏈微調CoT:
注入行業思維,提升推理深度
各行各業都有其獨特的思維方式,而精心設計的推理鏈,不僅能助力模型精準理解問題,還能顯著提升其推理的準確性和泛化能力。
DeepSeek透過蒸餾技術,將R1模型的思考能力傳遞給其他模型,讓它們也具備R1級別的思考實力。企業開發者可以提供優質的行業問題與示範,引導模型自主深入思考,以微調為橋樑,將千行百業的人類專家的思維模式和思考過程融入大模型的推理鏈條中,使模型更契合行業特點和實際需求。
強化學習微調RFT:規則框架下的自我進化
每個行業都有每個行業需要解決的問題和方法。強化學習微調,相當於賦予AI一套複雜的規則與思考框架,使其在反覆實踐與推理中,逐步掌握解決問題的高效方法。這一訓練方式依託微調資料集和測試資料集兩大核心資料集。模型先透過微調資料集進行學習,再使用測試資料集驗證推理能力,找出不足並針對性調整。透過這種持續迭代的自我訓練與驗證,模型推理能力不斷攀升,最終在特定領域達到專業級水平,為專業應用場景提供強大支撐。
得一微電子,引領存算技術新潮流
得一微電子始終錨定儲存控制、存算一體、存算互聯領域的技術前沿,致力成為行業領先的晶片設計公司。公司面向企業級、車規級、工業級、消費級等全場景應用,提供量身定製的解決方案與服務。
END
👇半導體精品公眾號推薦👇
▲點選上方名片即可關注
專注半導體領域更多原創內容
▲點選上方名片即可關注
關注全球半導體產業動向與趨勢
*免責宣告:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支援,如果有任何異議,歡迎聯絡半導體行業觀察。

今天是《半導體行業觀察》為您分享的第4049期內容,歡迎關注。
推薦閱讀



『半導體第一垂直媒體』
即時 專業 原創 深度
公眾號ID:icbank
喜歡我們的內容就點“在看”分享給小夥伴哦

