上手Lovart國內版星流Agent:細節滿滿,找到了最大公約數

作者董道力郵箱[email protected]
LiblibAI 近日推出了“星流Agent”,一款一站式創意設計智慧體,已同步上線移動端和網頁端。
簡而言之,使用者只需用語言描述需求,星流Agent 就能進行分析,生成所需的圖片、影片或設計方案。若對生成的圖片、影片或方案不滿意,同樣只需提出修改要求,它便會進行調整。
在官方宣傳中,星流Agent 與 Lovart基本被形容為國內版和國際版產品的分別,強調其深度優化了中文語義理解,並融入了東方美學元素,能精準適配本地設計場景,旨在成為“更懂中國設計師”的 AI 夥伴。

我們也第一時間上手深度評測了一下這款熱度很高的產品——體驗時,這產品一度因為網站流量過大而“崩潰”,可見人們對於它的好奇和需求。
在產品介面上,進入網頁端星流Agent工作頁面,大致可以分為四個區域。左上角工具欄,包含模式選擇、插入畫布、新增圖片、AI工具等選項。工具欄下方是工具的細節設定區,如生圖模型選擇、圖片尺寸設定等,功能類似於簡易版的 Stable Diffusion。中央區域是主要的畫布區,用於預覽生成的圖片、影片等內容,可以在畫布上進行快捷編輯。右側是本次測試的核心功能區——AI對話方塊,使用者的設計和修改需求都在此輸入。

我們將結合特定的工作場景,如設計海報、品牌設計、影片生成等,與星流Agent共同協作,從AI對自然語言的理解力人工參與的二次修改便利性等方向進行測試。
1
網頁端:生成海報
我們嘗試了一個設計師常見的任務:快速生成活動海報。
Prompts:幫我生成6張未來主義風格海報,描繪面部解構為埃舍爾式悖論建築:金屬與玻璃碎片重組成無限迴圈樓梯的顴骨、拱門狀下頜線、馬賽克幾何前額,裂縫中流動神經元光帶。量子晶體懸浮面部中央折射全息資料流,賽博朋克紫綠漸變光影在宇宙黑幕上投射幾何陰影,漂浮的二進位制星群營造深度幻覺——中央3D液態金屬字'AI產品'散發霓虹光暈,頂部全息'AI',底部光束鐫刻'攝影的起點與終點',左側微縮電路紋字'2025','0606'日期碎片嵌於建築結構,'AI產品'徽章懸浮,超精細CGI質感結合Beeple式未來主義美學,電影級體積光與極簡排版。
星流Agent 並未直接生圖,而是先對需求進行理解與梳理,為使用者提供了四個最佳化後的方向供選擇。相較於原始提示詞,星流Agent 提供的版本更為簡練具體,明確了海報主題、元素位置、背景顏色設計等,幷包含了“AI產品”、“0606”等關鍵文字資訊。
選擇方向一後,星流Agent 開始“工程化”處理該方向,生成包含海報比例、構圖、主體元素、配色光效、文字排版、細節要求的設計說明。這使使用者能清晰瞭解最終設計的構成邏輯。隨後,它挑選合適的工具(如 kontext 或其他模型)進行生圖。
生成的6張海報呈現在中央畫布中。審美見仁見智,但圖片的主體結構基本符合提示詞要求,關鍵資訊如“AI產品”、“0606”也得以生成。

1
網頁端:修改圖片
我們以第一張海報為例進行微調。圖中“攝影的起點與終點”是星流Agent 自行新增的文字,我們嘗試:1) 刪除該文字;2) 修改該文字。
選中圖片後,畫布上方出現常用工具(高畫質放大、擴圖、去背景、擦除等)。星流Agent 將每張圖片的處理過程打包成工作流,方便使用者追溯修改歷史。
使用擦除工具選中文字進行刪除,這個操作,AI給出的效果非常不錯,畢竟LiblibAI做AIGC工具起家。

同樣,修改圖片也支援自然語言。選中圖片後,按下tab鍵就會進入快速編輯模式,在輸入框中提出修改意見,就可以“用嘴來p圖”。但“用嘴p圖”只能面向整張圖片,無法選中某個區域進行修改。
prompts:把圖中[攝影的起點與終點]換成[AI產品改變生活]
星流Agent成功定位到需要修改的文字,卻把中文修改成英文。
也許是快捷編輯中的AI依然不夠智慧,我們將圖片放在AI對話方塊中進行處理,但星流仍然把中文改成了英文。
即便在prompts中明確使用中文,星流Agent還是返回了一張英文圖片,英文用到的單詞和上一張一樣,在翻譯的一致性上還是很穩定的。
當我再次強調是中文後,星流返回的文字效果異常。
這也體現了老問題,大模型對中文的適配依然不夠——對中文進行準確的圖片化生成,一直是各路國產模型在解決的一大類任務,並且能用來反過來判斷模型各種能力的提高程度。
我們繼續又嘗試修改圖片中的其他元素。
prompts:把模特的眼鏡換成紅色墨鏡
星流Agent 確認了眼鏡位置及特徵,成功替換為紅色墨鏡,並保持了原有特徵。
1
網頁端:電商海報
prompts:讓圖1中的人物,帶上圖2中的耳機
我們使用了兩張網路素材模擬電商廣告場景。星流Agent 初次生成時在人物性別和耳機顏色識別上出了錯,但經過第二輪解釋後成功完成任務。
相比 Stable Diffusion、ComfyUI 等工具,星流Agent 能幫助使用者生成更準確的提示詞並選擇合適的工具。修改圖片時能自動定位元素,節省了使用者手動繪製蒙版或使用 context 控制修圖效果的時間。
不過,這裡也引申出星流這樣產品的定位的討論,因為對於已熟練掌握 ComfyUI 等工具的設計師而言,它們在生成效果上目前並無太大差別,而且星流使用的需求多了會需要支付費用,對於他們來說可能付費意願會受到影響。不過,這樣的商業化產品瞄準的目標本來更多就是普通的沒有太多“動手組裝AI流水線”經驗的人們,目前來看這些功能足夠打動他們。與此同時,接下來產品迭代方向裡,生成的質量如何比開源和自己搭建的工作流有顯著提升,將是關鍵。
1
網頁端:品牌設計
prompts:我有一家名字叫[Hello AI]的咖啡店,幫我做一下品牌設計。
品牌設計是一個很寬泛的概念,相較於生圖、做海報,需要AI像設計師一樣反覆確認甲方需求。
星流Agent在看完需求後會先詢問使用者是否是要做“一套完整的品牌視覺識別系統,包括標誌設計、色彩系統、字型選擇以及品牌應用設計”,隨後還會從資料庫中提供一些參考案例,讓使用者來選擇。
在具體的細節設計中,星流給出了很詳細的設計建議,概念風格、主視覺、logo、色彩字體系統等等。

我們畢竟不是專業人士,於是諮詢了專業設計師,其對星流Agent 提供的設計方案表示認可。

1
網頁端:文生影片
prompts:幫我生成一段10s的影片,內容是一條長著翅膀的粉色哈士奇飛躍教堂。
在純文生影片任務中,星流Agent 的表現並未超越如可靈、即夢等平臺。其對提示詞的擴充套件主要在豐富物品/人物細節層面,並未主動提示使用者考慮景別等要素。經多次嘗試,它目前能生成5秒影片。
1
網頁端:圖生影片
prompts:基於這張圖生成一段影片,要求紅色方塊和藍色方塊互換位置
星流Agent 會先分析圖片,制定計劃(如先生成結束幀圖片,再呼叫影片模型)。生成影片後還會分析是否滿足需求,若不滿足會再次生成。測試中最多修改一次(生成兩個影片)。
相比在其他平臺無頭緒地修改提示詞,星流Agent 透過多輪對話完成任務的方式更有效率。
1
網頁:動畫短片
prompts:我想做一個動畫短片,內容是哈士奇拆家
和品牌設計需求一樣,動畫短片製作涉及風格、角色、分鏡、劇情等多環節,是較為複雜的AIGC任務。
星流Agent將動畫短片任務拆的很細,免去了使用者在大模型問答軟體、文生圖軟體、圖生影片軟體等之間的來回切換的操作。
1
移動端:生成桌布
星流Agent的移動端適合輕量級任務,如調整圖片尺寸、製作表情包等。
prompts:把圖中藍色的星球改成太陽,並且修改成適合iphone桌布的尺寸。
與網頁端流程一致,星流Agent 分析需求後選擇工具。但在這個案例裡,最終結果不盡人意:太陽被添加了星環,生成圖片尺寸過長,並沒有按需求直接匹配 iPhone桌布的大小。
此外,在試用過程中,我們發現星流Agent的網頁端和移動端專案互通,但目前只通了一半。在網頁端後臺可以看到移動端端專案,但專案名專案內容都無法顯示。而在移動端可以顯示並編輯網頁端的內容。

這類顯示不完全的小問題還有一些,比如在移動端使用者積分和新對話的UI重疊。

另外,目前星流Agent還是會有報錯的情況,有時會出現扣除點數但不工作,以及內容生成預估時間和實際時間嚴重不符等。這些都是今天AI 產品快速釋出快速迭代的常見問題了。後續期待有所修復。
在定價上,星流Agent的價格並不便宜,我們按照49元4000 Agent點數的連續月包會員為例,相當於1元=80點數。在星流Agent如今半價福利的情況下,80點智慧生成6張圖片,2.5s影片,還不算需求理解、內容修改等。

試用一圈下來,星流Agent還是有不少讓人驚豔的地方,它最打動人的,不是生成了多少張圖或影片,而是它努力扮演“設計師”角色的嘗試——理解需求、提供方案、迭代修改。而且這些都被體現在了產品的細節裡。當然目前它並非萬能也不完美,尤其在中文細節處理和價效比上仍有提升空間。
但對於那些“請專業設計師太麻煩,自己動手又太費勁”的輕量級、臨時性設計需求,星流Agent確實提供了一個值得考慮的選項:
一杯咖啡的錢,一個能陪你聊需求、出方案、改稿子的“AI設計師”,可能正是這類AI產品面對的市場裡的最大公約數。

點個愛心,再走


相關文章