國產開源大模型,重磅釋出!

3月6日凌晨,阿里釋出並開源全新的推理模型通義千問QwQ-32B
據瞭解,這是一款擁有320億引數的模型,其效能可與具備6710億引數(其中370億被啟用)的DeepSeek-R1媲美,但二者在引數量上相差將近20倍
據介紹,透過大規模強化學習,千問QwQ-32B在數學、程式碼及通用能力上實現質的飛躍,整體效能比肩DeepSeek-R1,同時大幅降低了部署使用成本,在消費級顯示卡上也能實現本地部署
目前,阿里已採用寬鬆的Apache2.0協議,將千問QwQ-32B模型向全球開源,所有人都可免費下載及商用。同時,使用者也將可透過通義APP免費體驗最新的千問QwQ-32B模型。
阿里通義團隊表示,未來將繼續探索將智慧體與強化學習的整合,以實現長時推理,探索更高智慧進而最終實現AGI的目標。
3月6日晚間,全球最大的AI開源社群Hugging Face更新了大模型榜單,阿里通義千問推理模型QwQ-32B成功登頂
同一天,騰訊混元釋出圖生影片模型並對外開源,同時上線對口型與動作驅動等玩法,並支援生成背景音效及2K高質量影片
基於圖生影片的能力,使用者只需上傳一張圖片,並簡短描述希望畫面如何運動、鏡頭如何排程等,混元即可按要求讓圖片動起來,變成5秒的短影片,還能自動配上背景音效。此外,上傳一張人物圖片,並輸入希望“對口型”的文字或音訊,圖片中的人物即可“說話”或“唱歌”;使用“動作驅動”能力,還能一鍵生成同款跳舞影片。
此次開源的圖生影片模型,是混元文生影片模型開源工作的延續,模型總引數量保持 130 億,模型適用於多種型別的角色和場景,包括寫實影片製作、動漫角色甚至CGI角色製作的生成。
開源內容包含權重、推理程式碼和LoRA訓練程式碼,支援開發者基於混元訓練專屬LoRA等衍生模型。目前在Github、HuggingFace等主流開發者社群均可下載體驗。
值得一提的是,以上兩款均為國產開源大模型
3月4日,十四屆全國人大三次會議大會發言人婁勤儉表示開源共享推動了人工智慧技術在全球的普遍應用,為世界貢獻了“中國智慧”
編輯|金冥羽  杜波
校對|陳柯名
封面圖片來源:視覺中國
每日經濟新聞綜合自公開資料
感謝關注每日經濟新聞,每天都有精彩資訊
推薦閱讀↓

馬斯克呼籲:放棄國際空間站!滯留太空9個月的兩名美國宇航員回應了

白宮爭吵後,萬斯又惹禍了


相關文章