1.智元機器人釋出首個通用具身基座大模型,模型基於創新的ViLLA架構,融合多模態大模型(VLM)和混合專家系統(MoE),透過預測隱式動作標記,彌合影像-文字輸入與機器人動作執行之間的差距。
2.超算網際網路平臺上線阿里巴巴開源推理模型QwQ-32B的API介面服務,提供免費100萬Tokens,使用者可透過超算網際網路平臺快速開發或私有化部署該模型,平臺提供保姆級教程,支援多種訪問形式。
3.北京大學聯合華為釋出DeepSeek全棧開源推理方案,方案基於北大自研的SCOW算力平臺系統、鶴思排程系統,整合了DeepSeek、openEuler、MindSpore與vLLM/RAY等開源元件,實現了華為昇騰上的高效推理,支援大規模算力叢集的訓推一體化部署。
4.Mistral Al推出Mistral OCR API,能精準識別文件中的文字、影像、表格、公式等複雜元素,支援多語言和多模態輸入,處理速度可達每分鐘2000頁。在基準測試中,Mistral OCR的準確率高達94.89%,全面領先其他OCR模型。
5.可靈(Kling)推出了其最新版本KLING1.6,正式上線三款AI特效:FuzzyFuzzy、MochiMochi和BoomBoom。這些特效使使用者能夠透過簡單的操作將靜態圖片轉化為生動的動態影片
6.Hedra Studio最近推出了Character-3模型,該模型透過多模態融合技術,能夠處理影像、文字和音訊,生成高質量的影片內容。使用者只需簡單上傳素材,便可快速生成生動的虛擬角色影片。
想要了解更多AI 行業資訊以及ChatGPT和AI繪畫實戰案例,歡迎加入我們的「網際網路AI早讀課」知識星球!
在這個星球,你可以更加系統的學習AIGC相關知識:
1. ChatGPT和AI繪畫(Midjourney+Stable Diffusion+Photoshop beta)基礎+進階全攻略;
2. ChatGPT和AI繪畫最直接變現案例;
3. 與200+行業先行者連結,積累你的專屬人脈資源;
4. 社群保姆級一站式服務,包教包會包討論;
現在加入,立享99元早鳥價優惠,星球使用者每漲100人,價格上調100元,直到恢復499元原價!
這個風口抓不抓的住,就看你願不願意邁出第一步了!
越晚加入成本越貴!最後兩個名額又要漲價了!
