MiniMax最新語音大模型超越OpenAI,取得國際評測榜單第一;Meta釋出CATransformers框架丨AIGC日報

1.【MiniMax最新語音大模型超越OpenAI,取得國際評測榜單第一】5月16日訊息,MiniMax近日釋出新一代語音大模型Speech-02。該模型在兩項國際權威語音評測榜單Artificial Analysis和Hugging Face TTS Arena 上,超越OpenAI、ElevenLabs等獲得雙榜榜首。據介紹,Speech-02在字錯率WER和相似度SIM等語音模型核心技術指標上取得了SOTA結果。(介面新聞)
2.【美國將與阿聯酋合作建立海外最大的人工智慧資料中心】 當地時間5月15日,美國白宮宣佈與阿聯酋合作建立人工智慧資料中心園區,據稱這是美國以外最大的人工智慧園區。阿布扎比政府支援的阿聯酋公司G42及多家美國公司將在阿布扎比合作建造容量為5GW的資料中心,佔地約26平方千米。研究機構蘭德公司分析師倫納特·海姆(Lennart Heim)表示,該資料中心的規模比迄今為止能看到的所有其他主要人工智慧基礎設施都要大,足以支援250萬枚英偉達B200晶片。(澎湃新聞)
3.【騰訊混元影像2模型釋出,支援文字、語音、草圖等互動方式】騰訊混元今日釋出業內首個毫秒級響應的即時生圖大模型Hunyuan Image2.0(引數規模提升數10倍),支援文字、語音、草圖等多種互動方式。此外,騰訊雲還透露,騰訊混元原生多模態影像生成大模型,已經在路上。(騰訊網)
4.【Meta釋出CATransformers框架:AI減排新路徑, 綠色科技未來可期】在人工智慧領域迅速推進的今天,meta的FAIR研究小組攜手佐治亞理工學院,共同推出了一款名為CATransformers的創新框架。該框架透過多目標貝葉斯最佳化引擎,聯合評估模型架構與硬體加速器的效能,平衡延遲、能耗、精度和總碳足跡。

特別針對邊緣推理裝置,CATransformers透過剪枝大型CLIP模型生成變體,並結合硬體估算工具分析碳排放與效能。其成果CarbonCLIP-S與TinyCLIP-39M精度相當,但碳排放降低 17%,延遲控制在15毫秒內;CarbonCLIP-XS則比TinyCLIP-8M精度提升8%,碳排放減少3%,延遲低於10毫秒。(新浪財經
更多AIGC資訊……

掃碼訂閱AIGC產業日報,
精選行業新聞,幫你省時間!👇

此外,如果您還想查公司、找專案、看行業,深入瞭解人形機器人、商業航天、AGI等熱門賽道,歡迎加入睿獸分析會員,解鎖相關行業圖譜和報告等。(活動期間加入會員可免費獲贈一份產業日報)👇👇

相關文章