DeepSeek接入Manus,開發速度飛快,確實可以封神了!

你好,我是郭震
近幾天有讀者問我Manus,比如Manus是比DeepSeek更好的AI嗎?Manus到底有技術突破嗎?
今天這篇文章解答下大家普遍關心的Manus問題,會以一個生動的例子幫助大家更好理解。
1 Manus與DeepSeek的關係
Manus首先是一個Agent,Agent是智慧體,最早在強化學習中也這麼叫,它能感知環境,並根據環境的變化做出智慧的決策。近兩年隨著AI大模型發展,如DeepSeek-R1,當Agent接入AI大模型後,讓其有了更聰明的大腦。
於是,就有了Manus。
如同上圖Manus的一句話介紹,它是通用AI智慧體。Manus與DeepSeek的關係,前者是AI的應用,後者是AI的核心。兩者不是同一層,沒有可比性。
既然Manus是通用AI智慧體,那麼它到底強在哪裡?下面我以一個生動的例子給大家介紹下。
2 Manus案例之謎境Agent
Manus最強大功能就是,它能夠獨立規劃、分解並執行復雜任務,與DeepSeek直接輸出文字答案不同,它能直接交付成果。比如,在互動小說創作領域,不知道大家最近聽過謎境Agent嗎?它就是神似Manus的一款更專的強大Agent。
今天我以此Agent為例,給大家介紹下Agent的相關技術核心。要想理解Agent技術,先要記住Agent的核心定位,本質上它是從“思考”到“執行”的全流程任務執行者,理解這點非常重要。
既然是全流程任務執行者,所以就拿互動小說創作來說,我們得先要拆解任務為幾個基本步驟,比如劇本編劇;畫師根據劇本創作角色圖;因為是互動小說所有得有開發者透過程式設計提互動動邏輯。起碼得有這三個基本創作流程,一般全流程下來,耗時大概4-6個月。
好了現在有了謎境Agent,上面三個基本操作流程就可以自動化了。具體來說,為了自動實現第一步也就是劇本編劇,因為DeepSeek-R1接入了此Agent,所以只需要輸入一句主題,DeepSeek就會開始推理劇本,如下所示DeepSeek-R1正在推理劇本:
這個Agent一次能生成多個故事主題,如下所示,主要偏懸疑主題,咱們主要看這裡的技術實現,一種常見的實現方法就是透過提示詞工程(Prompt Engineering),指導Agent生成然後自動再透過Javascript等前端技術渲染到介面:
然後Agent告訴我們,選擇一個導語方向基礎創作,當我們點選某個後就會進入到下一步,這個比較好理解。但是作為AI通用智慧體,隨著我們輸入偏好被Agent學習到後,這些導語選擇步驟都會自動化,使用越多,Agent對我們的喜好就越瞭解,Agent學習最後就會成為我們的智慧代理。
接下來謎境Agent會繼續幫我們創作大綱,以及對應的人物關係圖,如下GIF圖所示,這個也很有特色,想體驗的可以去試試,整個過程可能也就是分鐘級。這要放在Agent沒出來之前,沒有幾天時間大綱是出不來的。至此第一步劇本階段已經搞定。
3 謎境Agent自動完成第二步
第二步就是劇本對應的角色圖、場景圖生成,這在沒有Agent之前,得請專業的畫師,畫師拿著劇本去創作。有了Agent後,溝通、銜接、手工創作全部節省了,此Agent會全自動生成劇本對應的角色圖,咱們先看效果。
這是我在操作時生成的第一個分鏡效果,大家注意看此角色在窺視啥東西,懸疑感覺出來了:
緊接著,鏡頭拉到室內人物對話,再反轉到正面祝賀鏡頭,多次出現反轉,這裡面的故事細節就不在這裡詳細展開了,咱們想下這些鏡頭是如何對應到劇本的?其實DeepSeek也有很強的多模態能力,今年1月底DeepSeek釋出了Janus-Pro-7B,24GB顯示卡就能推理,能夠在本地部署推理採用理解-生成一體化自迴歸框架,精準做到圖文多模態生成:
Agent依靠多模態大模型能力實現了人物角色、場景圖的自動生成,基本做到比較精準了。
4 謎境Agent自動完成第三步
DeepSeek-R1本身具有比較強的推理能力,所以此Agent還增加有趣的互動模式,進一步把觀眾帶入小說中。
如下圖所示,此Agent在展開小說的同時,自動會計算出在哪個轉場後穿插互動,這些互動會和故事情節緊密相關:
要想實現類似這種互動,在智慧體設計時要明確提示DeepSeek在故事某些關鍵節點,穿插推理互動,DeepSeek-R1利用自身推理能力,會自動計算出來。
5 總結一下
像Manus這樣的智慧體,比如如謎境Agent,要想真正根據環境做出智慧決策,離不開聰明的大腦DeepSeek-R1。
在這裡環境可以理解為人類給它的一項複雜任務,比如這篇案例自動創作互動小說,當然要想實現自動化,也離不開Manus這樣的應用,有了它們才能實現高度自動化,比如謎境Agent實現的,自動生成劇本、自動生成人物設定和角色關係,自動生成分鏡和互動設計等。想要體驗的可以去這裡:https://www.ukilive.com/
Manus就像人的手,而DeepSeek就像人的腦,只有手腦並用,才能更好完成複雜任務。
Manus,拉丁語是 Mens et Manus,意思正是手腦並用。
以上就是這篇文章,全文2896字,7張圖,如果這篇文章覺得對你有用,可否點個關注。給我個三連擊:點贊、轉發和在看。若可以再給我加個⭐️,謝謝你看我的文章,我們下篇再見。


相關文章