我們和Flowith聊了聊,他們不想做通用Agent,但要做最好的AI創作工具

作者summer郵箱[email protected]
想象這樣一個場景:睡前用手機發個語音給AI,“明天我要採訪Flowith,幫我準備一份詳細的背景研究報告”,然後安心入睡。第二天早上起來開啟電腦,一份萬字研報已經靜靜躺在桌面。
或者,貿易政策天天變,告訴AI你需要即時追蹤特朗普的動態,7×24小時監控推特、新聞,每小時傳送最火熱點。
在Agent遍地開花的當下,這些聽起來很美好的設想,在實際體驗中卻往往伴隨著任務失敗、結果粗糙、成本高昂的“翻車”瞬間。
但 Flowith,正在穩定地實現它。釋出 2 天后超 10 萬線上使用者,50w+ 次 Agent 呼叫量,最近幾天,這款產品正在社交媒體上刷屏。
我們最近和他們聊了聊發現,根據Flowith團隊的介紹,他們並不想做所謂的通用Agent,而是更希望使用者和外界將他們看作一個AI時代的創作工具。
在對話中,Flowith還透露 Neo 只是一個開始,很快還將上線一個全新的 Agent 並且推出 iOS 端,滿足創作者各種日常需求。並且,在接下來的幾個月還會推出更多不一樣的 Agent 產品,就在這張小小又大大的畫布之中。
1
當“無限上下文”遇上“視覺化畫布”
Flowith給人的第一印象,是其標誌性的“畫布”介面和節點式的操作邏輯。對於習慣了線性對話互動的使用者而言,初上手可能需要一定的適應期,但一旦理解其核心邏輯,這種視覺化的工作流反而展現出直觀性。

我們圍繞Flowith宣稱的“無限上下文”能力和幾個典型應用場景,對Agent Neo進行了測評。

知識學習

Prompt:我想深入學習“Agent”這個領域,並最終能寫一篇綜述文章或做一個分享。
生成結果:https://flowith.net/view/e6ca4d3f-3114-4af2-a99b-0045eb5631f7

這是一個非常適合 Neo 的任務,思維樹本身就適合做知識整理。左側的工作流將任務分解為多個步驟,右側則是節點狀的結果拆解。
例如,在第一個步驟“線上研究”中,Neo分裂成了16個支線來搜尋資訊,包含了人工智慧和計算機科學中的代理定義、 智慧體的分類方法與型別、多智慧體系統、自主代理等 16 個搜尋關鍵詞,可謂是很全面了,最後才彙總成了一份正式的答案。
在這16個卡片(節點)中,你可以切換下方的滑動條塊,檢視搜尋關鍵詞和資訊來源。

在生成過程中,你還可以增加旁支來擴充你的畫布,不斷擴充套件相關子主題與關鍵詞,這也符合知識圖譜一直延伸的特性。

但是目前也存在一些不足之處。例如,不同分支間的內容不互通,特別是擴充新節點後,節點間的邏輯不清晰;且頁面中懸浮的AI Agent對話方塊,實際只是新對話入口,無法理解當前畫布內容。
我們緊接著又嘗試了一些熱門場景,大家可以點選生成結果,直接看到實際的輸出效果。

新聞監控

prompt:我需要你搜索今天的熱點AI新聞資訊,關注企業和人,併發送給我的郵箱,在傳送後,每隔一小時整理一次最新新聞資訊。
生成結果:https://flowith.net/view/68dcf74d-0233-4974-ac90-9f47021b5dca

我們同時在幾個主流 Agent 產品上測試了相似任務。結果顯示,只有 Flowith 的 Neo 能夠持續不斷地執行資訊蒐集,並且按照指令,定期將整理好的新聞摘要傳送到指定郵箱。
相比之下,一些 Agent 表示無法直接傳送郵件,或者在執行了一兩次後便中止了任務。反觀 Flowith,即使我們推出介面,開啟了新的任務,這個新聞監控任務依然在後臺穩定執行。

但是,生成結果的質量有待提升。且Neo沒有好好讀題,它並沒有整理當前 1 小時的最新訊息,而是連續 9 次傳送了差不多的“當日資訊”。

設計策劃

根據矽星人pro公眾號的內容定位及整體設計風格,製作一個矽星人pro線下AI社交活動的圖文策劃,要求:1、百分百符合矽星人風格 2、面向AI創業者、開發者、愛好者 3、設計包含活動主題、活動邀請函、活動海報、活動周邊。
生成結果:
https://flowith.net/conv/786621c5-ac15-4d7a-b384-9cb0cc4e0d61?U2FsdGVkX1/1lvDznW050Hd9yRWz6hGvbIodEcZjc6JqJPlnRnwSekLpu1D2/xcupih2WjxvXyuSuD5eJUw5wA==

還有一些不錯的使用者案例,例如最近Lovart 掀起的卡牌類設計。

做網頁版復古相機濾鏡小工具,可以上傳照片加濾鏡後,再載入下來(https://flo.host/grri9VX/)。

1
對話Flowith:做一個好產品,速度和創新才是創業公司的核心機會
矽星人:在AI Agent產品遍地的當下,你們的技術路線是怎樣的?是調了自己的模型,還是工程化整合?
Flowith:Flowith 短期對於智慧要求最高的場景不會做太多模型方面的工作,如規劃、工具呼叫等,因為目前各個模型廠商迭代、競爭速度非常快,自己訓練或者微調模型很快會被新發布的模型所替代。但對於智慧要求較低、已經穩定且成本敏感的場景,我們會用自己的模型來執行。除了模型外,我們做了很多工程化的工作,在去年開發 Oracle 時,我們就首創了自己的一套 Agent 框架、其成本、效率、可拓展性都有明顯的優勢,而 Neo 則更是如此。
矽星人:怎麼無限產出,怎麼不斷監督?
Flowith:Neo 實現了一套全新的演算法架構,包括對上下文的壓縮、疊加生成的演算法、以及更智慧的動態規劃,這些都超越了我們之前 Agent 的表現。比如無限生成這一塊兒,普通LLM一次最多輸出萬字左右的內容,因此當它開發網頁時候,網頁也很難突破長度的現實,而 Neo 在創作一個超長網頁時候,會像人一樣,採用逐步疊加的方式一直在一個專案裡增加內容,這個增加的步驟是無限的, 因此可以實現無限超長的內容輸出。
矽星人:這聽起來還是基於工作流的方式?
Flowith:Agent 的規劃出的路徑我們可以說是工作流,但和傳統工作流不同的是它更加動態,更加自適應,也有完全不同的組合和玩法。這些都是全面碾壓傳統人工編排式 Agent 的。
矽星人:無限上文,不會卡嗎?無限下文,為什麼不容易崩潰?
Flowith:我們在 neo 中,沒有用 RAG 等傳統的上下文長度最佳化的演算法,而是實現了自己一套新的機制,讓它可以更有效地達到無限記憶的功能。 因此neo 是在雲端執行的,因此它不受使用者本地瀏覽器、電腦和網路的限制,使用者把電腦關掉都可以讓它持續執行,穩定性也做了非常多的最佳化,因為LLM隨機性很大,因此這方面要做比較多的工作。
矽星人:你們自己做的工具,可以舉幾個例子嗎?
Flowith:一些簡單的就不提了,像是聯網搜尋、生成圖片這些的。我們開放上對一些核心工具花了非常大的功夫,比如生成網頁、和迭代網頁的工具。 迭代網頁,這個看起來需求很簡單,但實際上有很多工程性的問題,因為需要最佳化的網頁可能有上萬行程式碼,你不可能把全部程式碼餵給 LLM,也不可能讓 LLM 全面生成一遍,因此這部分我們做了很多工作,讓它可以達到目前這樣,可以無限迭代網頁專案、無限增加內容的狀態,雖然偶爾可能還會失誤,但整體的效能、成本、成功率已經非常高了。已經可以達到人類全程無監管的,讓 Agent 超多步驟的迭代一個網頁。
矽星人:我看到你們有個使用者案例,prompt是觀看影片、製作PPT,所以你們沒有采用browser use,而是選擇更傳統的抓取方式。為什麼不採用現在更受歡迎的讓Agent模仿人的視覺理解方式?
Flowith:我們其實在 Neo 的工具箱裡,也加入了 Browser use 的工具,讓它去執行一些特別的工作,比如深入一個網頁、或者觀看圖片、甚至影片等等。但我們不強調和推崇讓 Agent 使用這個工具,因為價效比和成功率太低,我們會給它提供多種資訊獲取的工具,讓它根據情況自我篩選,比如看影片,讓 Agent 去一幀一幀觀看影片的成本很高,速度也很慢,而我們可以透過獲取字幕和部分畫面的方式讓它更高效的完成。
矽星人:現在Agent產品太多了,像Manus、Lovart 等等,你們的差異在哪?
Flowith:Manus真的打開了這一波關注,我們首先是很開心看到這一點。其次是,我們不走太通用的路線,那就是AGI了。通用 Agent 要滿足比如幫你手機上點外賣、買機票、下單等現實互動,而我們的產品定位是一個 AI 時代的終極創作工作臺。
矽星人:既然是創作產品,那我們來聊下實測後的產品“問題”吧。Flowith的畫布形態很特別,但我們測試中,發現修改已經生成的節點內容,或者手動修改工作流的步驟,都不夠靈活,你們希望創作是AI全自動的嗎?
Flowith: 這個問題我們注意到了。目前版本的Neo在任務規劃(Planning)完成後,確實更側重於 Agent 的自主迭代和最佳化,因為 Neo 的執行週期更長、我們無法期待使用者一直和 Agent 保持即時協同,在這種場景下使用者更期待 Agent 把所有工作自動執行完。
但我們也理解使用者希望有更高自由度DIY的需求。之前的Oracle版本其實支援更靈活的Plan修改,我們也會持續收集使用者反饋,評估如何在未來的產品迭代中更好地平衡 AI 的自主性與使用者的控制權。目前,使用者可以透過“常規模式”對每個節點進行追問和派生新任務。
現在的Neo肯定還是一個早期的版本,我們也在一直最佳化迭代,很快會推新的 agent 以及最佳化來解決一些問題。
矽星人:還有哪些更新,能透露一下嗎?
Flowith: 可以稍微透露一些。我們這周(或很快)會上線一個iOS客戶端。它更偏向於手機端便捷使用,支援語音輸入。你可以想象睡前用語音給它佈置十個任務,第二天早上在電腦或手機上就能看到結果。這會讓Agent的可用性大大增強。
其次,我們還上線了一個影片工作流。使用者將能透過Flowith,用類似於現在生成圖文的方式,去創作和剪輯影片內容。我們甚至用Neo自己剪輯了一個嵌在3D互動網頁中的宣傳片,效果很有意思。
未來,我們還在規劃一個新的Agent更像一個總指揮,解決更長期複雜的目標。
矽星人:你們自己會用Flowith來提升工作效率的,比如你的賬號就在社交平臺上特別活躍,有科技與狠活嗎?
Flowith: 確實有<笑>。小紅書賬號的運營,就是我和早期版本的 Neo 做的,過去兩三個月,三個號漲了好幾萬個粉絲。
小紅書是一個完全基於內容演算法推薦的平臺,製作圖文也相對更快捷簡單,我也是一個 Vibe Marketing 的提倡者。我自己用Flowith搭建了一套輔助社交媒體運營的工作流。
另外,使用者的評論也有 Neo 幫忙,因為我的評論區和私信比較多,把連結一整個剪下給 Neo,批次生成回覆,我看一眼,沒問題,就傳送,還是解決了很多時間的。
當然,因為模型水平在那兒,很多句子還是不能用的,算是半自動吧。
矽星人:現在累計 10 萬線上使用者,成本方面會是困擾嗎?
Flowith:我們在成本上做了特別多最佳化。大家如果使用多了會發現,我們做相同任務的token消耗量其實比其他所有Agent都要少很多,在相同定價下,也可以獲得更多credits。因為我們在成本上有優勢,在模型選擇上的動態調整,以及工具大部分都是靠自己的,讓我們現在完全扛得住。
矽星人:從去年上半年上線產品,到現在一年多,團隊現在多少人?有什麼擴張計劃?
Flowith:現在十多個人,也希望有更多願意一起去創作的冒險家加入我們。我們在上海和矽谷兩邊都有team。我們自己覺得我們就是一群特別真誠的人,雖然還是很早期的創業團隊,但我們有很多新的資訊可以分享,像今年3月份,Flowith已經達到130萬ARR了,使用者數20萬,沒有花過一分錢做投放,這是一個產品驅動的增長。當然,我們也希望有更多人可以關注到 flowith。

點個愛心,再走


相關文章