講真,這次真的碾壓了OpenAI!|MiniMaxAgent釋出30天后,迎來首個重大更新

全技術棧開發,讓更多的想象力成真了。

👦🏻 作者: 鏡山
🥷 編輯: Koji
🧑‍🎨 排版: NCon

進入 2025 這個被譽為「Agent 元年」的下半場,我們見證著一眾 AI Agent 的智慧水平正朝著同一個新目標快速發展:
用全技術棧把創意直接變成可執行的產品。
就在上週,有媒體報道 AI 獨角獸 MiniMax 完成了新一輪融資,公司估值突破 40 億美元關卡。這家成立三年多的「年輕」公司再一次獲得資本青睞。
而就在上個月的 MiniMax Week,他們做了一系列開源動作:從超長上下文的 MiniMax-M1 推理模型,再到 AI 影片模型 Hailuo 02、MiniMax Agent 、Hailuo Video Agent、Voice Design,在各個技術社群引起了廣泛關注。
30 天前,MiniMax Agent 產品剛上線時,我們就做了第一時間的全面測評:《MiniMax 的 Agent 做得怎麼樣?|我們實測了 7 個案例,給出 3 點思考》。  
之後我們一直在跟進這款 Agent 產品的更新和迭代。
現在,這位擁有完整 AI 技術棧的實力玩家 MiniMax,又讓他們的 AI 原生 Agent 產品完成了一次關鍵升級——全棧開發能力正式上線。

🚥

接下來的部分,我們將分享完整的評測報告,以及對Agent全技術棧能力的2個核心洞察。

全棧開發讓更多的想象力成真了

1)來打造一個「十字路口 Crossroads」播客社群吧!

亮點:深度搜索、視覺識別、支援 Supabase、會員系統、Stripe 付費
MiniMax Agent 現在支援全棧開發,也就是說,前端介面和後端功能可以一起搞
比如我們想做個幾乎涵蓋所有基礎功能的「十字路口 Crossroads」播客社群,就可以輸入:
打造「十字路口 Crossroads」播客社群(支援 MiniMax MCP + Stripe 支付) 你是一名全棧開發者,目標是開發一個類似 Spotify 的播客社群平臺,命名為「十字路口 Crossroads」。該平臺透過呼叫 MiniMax MCP 介面,將使用者上傳的播客文稿自動生成語音內容,構建一個圍繞播客內容的聽、評、聊、付費下載的一站式社群。  🎯 核心目標: • 支援上傳播客文稿 → 自動生成 AI 音訊 → 釋出為可播放內容; • 聽是免費的,但下載每個音訊需支付 5 美元(透過 Stripe); • 平臺具備基礎社群互動功能和內容稽核機制。

這個時候,MiniMax 會提醒你去 Supabase 註冊一下,這是一個 「開源版 Firebase」的系統,可以快速構建後端,不需要自己搭建伺服器、資料庫和認證系統。

註冊流程很簡單,MiniMax Agent 會自動提醒並給出網址:
在 Supabase 註冊完成後,建立一個專案,剩下的事情就完全不用管了——Agent 會自動處理所有技術對接。

Supabase
我整理了下開發播客社群平臺「十字路口 Crossroads」的完整流程,大致分為四個階段:
第一階段就是後端搭建,Agent 會自動建立資料庫結構,配置檔案儲存等基礎功能。整個過程有詳細的執行日誌,可以看到每一步在做什麼。
剩下三個階段就是前端開發,使用者系統與支付功能,功能完善與上線部署。

任務流程上,我很明顯地感受到新版本 MiniMax Agent 現在的「反思」能力更全面了。即使網站已經部署完成,Agent 還會繼續最佳化,新增更多社群互動功能,力求做到完美。

在完成構建並部署上線後,MiniMax Agent 還會進行端到端測試與總結。
可以說,MiniMax Agent 這回最大的特點就是它「端到端」能力提升了一大截:
最後,MiniMax Agent 給出的是一套「前端 + 後端 + 資料庫/儲存 + 邊緣函式 + 支付整合」的完整全棧專案。
你可以下載所有程式碼檔案,也可以將成品網站 Share 給他人(親測有效):

下面來讓我們看看 MiniMax 生成的播客社群,功能有多完整。
首先是網站首頁,基本上該有的要素都有了,每一個模組都連線著後臺資料庫,全部可互動:
MiniMax Agent 提供的這個建立賬戶功能並不只是個模擬器或者是前端展示,它背後連線了 Supabase,能完整實現註冊、啟用、登入的全套流程
比如說,我們可以直接在和 MiniMax Agent 聊天時,把自己的郵箱設為管理員,註冊完就能管理整個網站後臺了。

當你在上面這個頁面系統裡註冊賬戶後,會收到來自 Supabase 的郵件,點進去就等於啟用賬戶:

最能體現 MiniMax Agent 全棧能力的就是它提供了完整的後臺。
在「個人主頁」裡,你可以重新設定賬號、名稱、收藏夾等等;在「上傳播客」頁面可以完整地上傳音訊檔案。

在「管理後臺」的總覽頁面,我們能看到有多少使用者登入了播客社群,還有訂單購買時間、收入等資料,全都是即時更新的。

新版 MiniMax Agent 與提示詞的一致性更好了。
比如,你如果在提示詞裡設定一句「登入賬戶,才可以評論」的功能,出來的成品裡就會出現這個新功能,而且所有匿名使用者的評論也同樣會被記錄在網站裡:

當然,頁面的美觀度還有改進空間。
這時候我們可以發揮想象力,一次性給整個網站換個全新風格,比如:
任天堂復古遊戲風,低解析度,黑色背景
MiniMax Agent 的「端到端」能力,讓它能夠保持極佳的一致性,迅速地為整個網站規劃元素相似的風格:
與此同時,我還為這個「十字路口 Crossroads 播客社群」的使用者設了一個規則,每個播客售價 5¥:

為了實現付費功能,需要接入 Stripe 支付平臺(一家全球線上支付處理平臺)的介面。設定過程很簡單,MiniMax Agent 會直接給出註冊網址,進去註冊就行了。
像是下面這樣:

這樣一來,所有使用者登入網站後必須付費才能下載播客音訊。
我錄製了一段 Gif 展示了具體測試的過程。
當你點選付款按鈕後,如果賬戶餘額足夠成功支付的話,才可以去下載音訊,整個流程很流暢,沒有出現功能銜接不了的情況:
我也把這段音訊放上來了,是關於「Koji 與鴨哥」的一段訪談內容:
用下來感覺 MiniMax Agent 的工作流程越來越熟練了。主要是因為它的任務起點是「深度搜索」,資訊儲備很充分,所以最終輸出的結果一致性很高。
它能以極快的速度從 0 到 0.99,構建一個完整的平臺。
我再舉個例子,只是簡單輸入一段這樣的提示詞:
把這個播客社群轉換成 Spotify 風格,簡潔有美感。
MiniMax Agent 在幾分鐘內就做出了一個工業美學風的播客臺:
裡面很多元素的一致性非常非常高,且每個播客欄目的封面圖與標題之間的協排程也很好。
像是「海洋詩篇」、「街道故事」欄目等等,很文藝:
在實際體驗過程中,我還發現 MiniMax Agent 在批次搜尋圖片和視覺識別方面越來越得心應手了。以前讓它做這類任務,它只是按量完成,現在則是追求更高的完成度
大概就是之前求「做完就行」,而現在是「求精、求好」:

2)一句話就可以構建的「 AI 算命 MCP 」

亮點:搭建可複用 MCP、接入大模型 API
現在,MiniMax Agent 支援一句 Prompt 直接構建 MCP,還能儲存到本地或者直接在聊天框裡重複使用,甚至儲存到工具欄裡隨時呼叫。
比如,我想做個「算命服務」MCP:讓我輸入任何內容,它用「算命大師」的語氣來回答,背後呼叫 MiniMax 的 API 來支援。
就可以輸入下面這段提示詞,需要的朋友可以直接 Copy:
你是一位全能AI開發助手,請為我建立一個基於MCP協議的“算命服務”MCP伺服器。
1. 使用 Python 編寫;
2. 支援運行於MCP框架中(例如MiniMax Agent平臺);
3. 實現一個名為 fortune_telling 的MCP操作; 
4. 使用者輸入一段描述內容,系統將其作為 user_input 傳入;
5. 後端呼叫大模型,使用如下 prompt:    “你是一位通曉命理、星象、八字與塔羅的算命大師,請根據以下內容進行命理解析,要求包含:①性格分析②當前運勢③建議,風格神秘隱晦,不給具體時間,只談趨勢,語言富有象徵性,不使用現代詞彙。使用者內容為:{{user_input}}”; 6. 將生成的內容作為 output 返回。 後端呼叫大模型MiniMax的API,(API Key為______)
MiniMax Agent 幾乎簡化了中間需要人力操作的複雜步驟。
比如以前最讓新手頭疼的就是「工具除錯」,現在它會自動測試,執行自己做好的 MCP 工具,看結果是否成功輸出了:

完成後,你只需要輸入幾個字和 API Key,就能儲存到 MiniMax Agent 裡,以後隨時複用,這點做的還是挺貼心的:

有了趁手的 MCP 後,我們就可以基於它「隨意」開發了。
比如最簡單的就是讓它做一個前端介面,將 MCP 嵌入其中,構建一個完整的「天機占卜」網站。
提示詞如下:
請建立一個充滿東方古韻的算命網頁前端,使用者輸入提示詞,你呼叫「算命服務」MCP伺服器,輸出結果,字型為宋體,體現中華傳統文化的深厚底蘊和古典美學:
一個「探天機·觀人生·知命運」的古風網站就很迅速地完成了,你可以提問多種型別的問題:

這種一句話就能構建出來的可複用且非常成熟的 MCP,確實為「靈敏開發者」們提供了更多的想象空間。

3)定時全網搜尋的「AI 初創公司融資新聞站」

亮點:Cron job 自動執行、全網搜尋
MiniMax Agent 現在還支援 Cron job (定時任務),能夠更靈活地設定時間間隔,自動執行指令碼或命令。
像是,我想用它做一個 AI 初創公司融資資訊新聞站,1 分鐘更新一次,就可以輸入下面這段提示詞:
每隔 60 秒自動呼叫一次 Serper API 使用關鍵詞如 “AI 初創公司融資” 或相關短語進行搜尋 從 API 返回結果中提取最新的一條新聞:標題、摘要、來源連結 在頁面上顯示最新新聞內容,無需手動重新整理 頁面應自動更新:舊內容被最新內容替換(或可選擇以列表形式累積展示)
這裡,你需要去 Serper[1] 註冊一下拿到 API,這是一個為開發者提供 Google 搜尋相關 API 介面的平臺,註冊完後就可以隨時呼叫它的搜尋能力了:

大概幾分鐘過後,一個比較有科技感又富有動態互動效果的 AI Funding News 網站就順利建好。
進入這個網站,一開始會有「最新 AI News 雷達搜尋」效果的展示。
等它搜尋完畢後,來自全網多個資訊來源的 AI 初創新聞都被完整地列好,並且每 60 秒可以更新一次:

像是我點選 Reuters(路透社)的一條「美國人工智慧初創公司融資激增,資料顯示更多風投基金融資受阻」新聞,它會自動跳轉到該條新聞所在的網站,整個過程很流暢:

4)高度一致性的「彩虹小熊」PPT

亮點:圖片生成、高一致性 PPT
與上回我們介紹 MiniMax Agent 的流程一樣。
這回我在試用時,發現它做 PPT 的效果還不錯,所以我就準備讓它用「彩虹小熊」風格,來給自己的工作流程建立一個完整的 PPT。
提示詞如下:
基於我上傳的MiniMax Agent工作流程Word文件,建立一個完整的PPT簡報,將文件內容進行視覺化呈現。 PPT裡所有的圖片全部用自己生成的可愛彩虹小熊,生成一個萌寵環遊世界的主題海報,繪製一系列萌寵在世界各地標誌性建築或風景前的可愛插畫。 每一張PPT用一張小熊的插畫,如萌寵在埃及金字塔旁玩耍、於中國長城上漫步等,透過色彩鮮豔、形象生動的畫面來直觀呈現主題;或者設計以萌寵環遊世界為主題的海報、貼紙、動畫等,在畫面中融入地圖、飛機、行李箱等旅行元素與萌寵形象相結合,突出主題的趣味性和活力感,吸引觀眾的目光。
看一看 MiniMax Agent  的效果吧,是不是非常可愛,每一張 PPT 的一致性都很高。
這一整套「MiniMax Agent 智慧工作流程」涵蓋了它工作時的六個階段,甚至自動總結出了它的實際案例、功能和技術棧:

整個使用過程非常流暢。雖然複雜任務需要註冊一些第三方平臺(如Supabase、Stripe),但 MiniMax Agent 會明確告訴你需要哪一步,提供註冊地址,讓整個流程很清晰。

全技術棧的 Agent 有什麼吸引力?

1)技術門檻正在消失,創意與生產力直接掛鉤

我還依稀記得幾年前,如果想要做個「湊合能用」的網站,你得找前端工程師負責使用者看到的頁面,找後端工程師處理資料邏輯,還要有人搞定資料庫儲存。一個簡單的網站,可能需要 3-4 個技術人員配合,花費幾個月時間。
當 Agent 能夠以全技術棧進行 Vibe 開發時,現在只要會說話,說「自然語言」就行,靠感覺、靠想法來開發。
像是一句「做個播客社群」,幾分鐘後就有了包含使用者系統、支付功能、內容管理的完整平臺。這不是演示,是真能用的產品。
這種變化最直觀的體現就是:想法驗證的時間被大幅壓縮了。一個有想法的普通人,他的能力被 AI 成倍放大了。
「1 個人的公司」正在快速成真,技術壁壘在消失,但是這同樣意味著使用相同 AI 工具可能導致創業者們的產品同質化,如何差異化成為關鍵。
創意和市場洞察變得比以往任何時候都更重要。

2)端到端能力的需求,比以往任何時候都重要

當市面上出現如此多的 Agent 產品後,使用者的品味早已經變得挑剔。AI Agent 不應再滿足於「做完就行」,而是追求「做好做精」。
以前的 AI 工具更像個實習生,交代什麼做什麼。現在更應像個有經驗的員工,不僅完成任務,還會主動最佳化、反思改進。
可以說,「端到端能力」是 Agent 的新 Benchmark(基準測試)。
比如播客平臺做完後,它還會自動進行端到端測試,確保每個功能都能正常使用,甚至「是否達到生產級標準」。
什麼樣的 AI Agent 最會被喜愛?我們總結了下:
【1】Agent 能夠在過程中主動進行最佳化,承認自己做的「不足」,在生成的過程中自動測試各種功能,儘量別麻煩使用者;
【2】Agent 需要保持風格統一,換個主題能保持整體設計協調。就像一個有經驗的設計師,知道怎麼在變化中保持統一感。

🚥

前幾天,OpenAI 終於正式展示了他們的 Agent 產品,把 ChatGPT、DeepResearch、Operator 這些技術都封裝整合進了一起。
這正好說明,AI Agent 的「故事主線」才剛起了個頭。
接下來估計還會有更多公司加入這場「AI Agent」的競賽,展現他們誰更懂技術、更有品味、更瞭解使用者需求。
不過,大家的終極目標都非常美好:
讓有想法的人終於不用再等別人來幫忙實現了。
那麼,你想解決什麼有創意的問題?又想為誰創造溫暖的價值呢?

參考資料

[1]

Serper: https://serper.dev/


相關文章