1.【階躍星辰開源影像編輯模型Step1X-Edit】4月27日,階躍星辰宣佈開源影像編輯大模型Step1X-Edit,效能達到開源 SOTA。該模型總引數量為19B(7B MLLM + 12B DiT),具備語義精準解析、身份一致性保持、高精度區域級控制三項關鍵能力;支援11類高頻影像編輯任務型別,如文字替換、風格遷移、材質變換、人物修圖等。(每經網)
2.【阿里巴巴AI旗艦應用夸克釋出全新“AI相機”】阿里巴巴AI旗艦應用夸克AI超級框釋出全新AI相機,上新“拍照問夸克”功能。基於AI超級框背後的視覺理解和推理模型能力,全新的夸克AI相機能深入理解使用者意圖,更好地實現視覺搜尋、多輪問答、影像處理與創作。(財聯社)
3.【Meta Token-Shuffle登場:自迴歸模型突破瓶頸,可AI生成 2048×2048 解析度影像】報道稱Meta AI創新推出Token-Shuffle,目標解決自迴歸(Autoregressive,AR)模型在生成高解析度影像方面的擴充套件難題。在語言生成方面,自迴歸模型大放異彩,近年來也被廣泛探索用於影像合成,然而在面對高解析度影像時,AR模型遭遇瓶頸。不同於文字生成僅需少量token,影像合成中高解析度圖片往往需要數千個token,計算成本隨之暴增。這讓許多基於 AR 的多模態模型只能處理低中解析度影像,限制了其在精細影像生成中的應用。儘管擴散模型(Diffusion Models)在高解析度上表現強勁,但其複雜的取樣過程和較慢的推理速度也存在侷限。(搜狐)
4.【Adobe釋出Firefly Image Model 4模型:AI生圖再升級】Adobe釋出博文,推出Firefly Image Model 4和Firefly Image Model 4 Ultra兩款文字生成影像AI模型,並預告針對Photoshop和Illustrator的Creative Cloud應用更新。Firefly Image Model 4強調速度與操控性,被Adobe稱為“迄今最快、最可控、最逼真的影像模型”,最高支援生成2K解析度的影像,風格、尺寸和相機角度控制更加精準。(IT之家)
更多AIGC資訊……
掃碼訂閱AIGC產業日報,
精選行業新聞,幫你省時間!👇

