最近 Manus 爆火,很多人都苦於沒有邀請碼,只能看著有碼的人體驗 “ 別人給自己幹活 ” 的快感。
為啥這東西這麼吸引人呢?還是因為現在的大語言模型,只能和你進行 “ 言語交流 ” 。你跟它說 “ 這個東西我不會 ” ,它會給你羅列出詳細的步驟,但絕對不會幫你完成。完成工作,是隻有碳基生物能幹的事,矽基生物它做不來。
而 Manus 一齣,就展現了超越傳統大模型的自主執行能力,不僅能理解複雜指令,還能拆解任務、呼叫工具等。網友一看,好傢伙,這不就是個幫我打工的私人助理嗎?
但這玩意也沒那麼全能,只能算個 “ 套殼產品 ” ,雖然是集成了很多工具包,但如果是它工具庫裡沒有的,那就完蛋了。
比如,你能讓 Manus 幫你 PS 個圖,用 PR 剪個影片,再把工程檔案發給你嗎?對不起,做不到。也就是說,它離我們真正的 “ 生產力工具 ” 還很遠。
但最近世超在 GitHub 上發現了個比較火的專案,可以讓大語言模型幫你建模。這可不得了,可以說是讓AI 成為真正生產力工具的重要一步,現在這個專案已經收穫了 6.8k 的 Stars ,還在快速增長。
世超看完演示影片,發現作者僅僅透過與 Claude 對話,就使用 3D 建模軟體 Blender 建立出了一幅精美的模型。整個建模過程無需敲程式碼,更無需學習軟體操作,只需要透過語言描述需求即可完成。
影片裡,作者直接在對話方塊裡輸入: “ 請用 Blender 幫我建立一個場景,有一條龍站在一罐金子旁邊 ” 。
隨即, Claude 就開始呼叫 Blender 開始建模了,很快啊。
最終成品圖如下:
看著效果確實不錯啊,那必須體驗一下了,畢竟作為懶狗,看著別人把活全乾了確實有種不能拒絕的快感呢。
於是,我找到專案文件,照著上面的步驟,用不了一小時就把專案部署完成了,確實簡單。整個過程也不需要寫程式碼,完全的滑鼠操作。
體驗了一個上午,先說結論:趣味性十足,實用性一般。
首先我試驗了一下,能不能達到影片中的效果。我直接把影片中的提示詞複製過去,他還真列出步驟一步一步開始做了:
就是這效果。。不能說是一模一樣,只能說是有點關係:
不過影片顯示啊,作者在該提示詞的基礎上進行了多次微調,世超由於對建模一竅不通,不懂怎麼調整建模細節,所以造成了實物與原圖不符。感興趣的差友們可以嘗試復刻一下影片中的效果。
哎,不然來個簡單點的,就給我畫條龍吧?我們來看看對這種簡單直接的要求,它的完成度怎麼樣。
於是,我直接跟它說:給我畫條真龍。
看它輸出的步驟,真是有模有樣的,先畫龍身,再畫龍頭,然後是龍爪和細節修飾。。
結果呢?
你還別說,跟樓上那條龍真有異曲同工之妙。看來大模型對龍的理解就是這樣了,又龍又豬的。沒關係,反正都是十二生肖嘛。
額,真龍畫不出來,奶龍總行吧?我把奶龍的細節特徵全給你描述清楚,你給我畫,就不會出錯了唄。
必須動手。我給的提示詞是: “ 畫一條黃色怪獸,圓圓的頭,肥胖的身軀,短胳膊短腿,還有恐龍尾巴和綠色眼睛。 ”
它立馬就開始動手了,很快啊。
最終結果令我拍手叫好:
說實話,這是給它的幾個任務裡,完成度最高的一個了,起碼能看出來是條奶龍了。
不過呢,這些其實都是些神秘的東方元素,對西方大模型來說,畫不出也可以理解。
有沒有什麼世界各地都常見的東西?我想了想,讓它給我畫棟房子吧。提示詞很簡單:畫棟房子。
在經過一番全自動操作後,它給出了最終成品:
嗯,確實還不錯,有門、窗、樹甚至煙囪之類的東西。就是旁邊飛了兩根橫樑不知道是做什麼的。。
這幾輪體驗下來,感覺只能說勉強可以,畢竟是零基礎建模師,建出能看出形狀的模型已經算是勝利了。
世超也把它的作品給專業 3D 建模的同事看了,同事表示:其實它現在只會簡單的幾何體堆砌,就像小孩搭積木一樣,沒有建立複雜模型的能力。
總結一下就是:能用,但也僅限能用。想給專業人士幫上忙,其實還遠著呢。。
但對現在 AI 的發展來說,還是個不小的進步, AI 從 “ 摸不到工具 ” 到 “ 能摸到工具了 ” ,那給人類打工這件事還會遠嗎?
那麼話又說回來,不是說讓 AI 實現工具使用挺有難度嗎?這個是咋實現的呢?
其實,怎麼能讓 AI 使用我們的生產工具幹活,一直是 AI 從業者研究的難題。因為現在的 AI 和生產力工具們,還沒辦法直接 “ 交流 ” 。
舉個例子,《 聖經 》中說,最初所有人類都使用的是同一種語言,為了防止人類合夥建造通天塔,上帝一聲令下,把大夥的語言都分隔開了。
而現在的各大 AI 和人類的工具、資料庫之間呢,也有這種 “ 語言不通 ” 的矛盾。
為了解決這個問題,在去年 11 月,一位叫 MCP ( Model Context Protocol ,模型上下文協議 )的重量級嘉賓就閃亮登場了。
它是由 Anthropic 提出的一種開放標準協議,你可以把它理解成一個 AI 世界的 “ 翻譯官 ” 。不管你是什麼東西,只要支援 MCP 協議,它都能使大模型的 “ 語言 ” 讓其他使用 MCP 協議的工具 “ 聽懂 ” ,這樣一來,壁壘就被打破了,通天塔不是就指日可待了嘛?
如果未來越來越多的應用使用 MCP 協議,我們的 AI 就能輕鬆呼叫它們進行工作,人類就能正式進入 “ 解放雙手 ” 的時代了。
上面介紹的建模專案呢,就是使用了 MCP 協議,把大模型和建模軟體連線了起來,所以咱們每提一個要求,大模型就能根據要求呼叫建模軟體進行執行。
隨著時間推移,已經有越來越多的工具加入 MCP 的隊伍中了。
比如, VSCode 上的一個叫 Cline 的外掛,本身是使用 AI 輔助程式設計的,最近也宣佈支援 MCP 了,這意味著這款外掛可以使用 MCP 生態下的全部功能。
比如一款爬蟲工具 Firecrawl ,能把各大網站的資訊爬下來,然後轉化成對大模型友好的 Markdown 格式。
程式設計師用這款外掛時,想在網站上爬點有用的資訊並餵給 AI 總結, so easy 好吧。
不過據傳 Manus 沒有使用 MCP 協議,世超覺得如果未來 MCP 成為主流, Manus 也就隨即失去意義了。。畢竟大傢伙都能 “ 萬物互聯 ” 了,還需要你個整合工具包乾什麼呢?當然這也都是展望階段,未來到底怎麼樣,還不好說。
不過最近的幾波新聞,都代表著 AI 離 “ 替人類幹活 ” 越來越近了。你說大家不擔心搶工作,那是不可能的,畢竟你永遠不知道下一個被替代的職業是什麼。。
所以,你的職業離被 AI 拿下,還有多遠呢?
撰文:不咕
編輯:江江 & 面線
美編:煥妍
圖片、資料來源:
X 、 Youtube 、 Anthropic