我用釦子,把夕小瑤做成了表情包!

自從前段時間更新了文章版面後,就經常有家人在 Family 群裡誇——
然後就會有人瘋狂追問這是不是用 ai 做的——
眾所周知,由於夕小瑤太窮,請不起專業的設計師,但由於自身 AI 能力過硬,所以必然要讓 AI 來充當這個苦力。
不過,事情的進展並沒有止步於此,因為還有很多家人要求出表情包。甚至還有家人直接在評論區逼宮,求插入表情包的。
安排!但我試了一圈市面上國內外各類 AI 工具,把 prompt 調炸了也沒有一個能生成出來讓我滿意的表情包的。這竟然讓我犯了難。不是表情控制不到位,就是人物風格不一致。。。
我本以為這事兒可能也就止步於此了。結果恰好這兩天受邀參加了火山引擎在上海舉辦的 Force 原動力大會。
人超級多。。。但這不是重點,重點是,這場大會帶來的升級太多了,豆包大模型全家桶升級、火山引擎大模型開發者產品全家桶,有個詞兒很合適——
目!不!暇!接!
當我在大會現場恰好聽到 AI 應用開發平臺「釦子」也迎來重磅升級後——
我腦子的反應就是:
你要是能把我手裡這個困擾了我數天的夕小瑤表情包生成的問題解決了,我就承認你沒吹牛。
說幹就幹!
我直接在現場打開了電腦,開始用釦子手擼表情包生成的 AI 應用。
(有沒有攝影師小哥哥來投個簡歷,以後陪我參會拍照的)
首先是在釦子(coze.cn)點“建立應用”的按鈕,就能看到這個最新版釦子才有的 Project IDE——
如頁面上方所示,這個 Project IDE 分業務邏輯和使用者介面,你可以直接理解成 AI 應用的前後端。這裡我們先重點關注後端邏輯。而後端的重點,就是要把 AI 應用的工作流給構建出來——
直接點選左上角的新建工作流,你就能看到上圖這張巨大的無限畫布了,然後在這裡面定義各個節點的操作,包括輸入輸出是什麼,中間的處理邏輯、功能呼叫、prompt 等,都可以在節點裡定義。
如果你是技術出身,肯定秒懂;就算非技術出身,跟著官方教程理解一下也很容易上手
在這裡,我的重點是先給它一張夕小瑤 IP 的母圖,然後將表情關鍵詞設定為輸入變數,將表情包風格、人物細節等在表情包中要固定住的元素就寫在提示詞區域。
你們注意到下面那個“試執行”按鈕了嗎?這活脫脫不就是程式設計師 IDE 裡面的 Debug 按鈕嘛,可以透過這個按鈕反覆的除錯你的提示詞和工作流配置,這個迭代的感覺很神奇,有一種在用賽博 IDE 的感覺。
然後就是設定下輸入輸出,這裡可以靈活控制資料流,但我們這個場景很簡單,一共就輸入-影像生成-輸出這 3 個節點就串成了一個最簡單的工作流。
至此就完成了整個後端邏輯的搭建。
然後我切換到了上面這個叫使用者介面(UI Builder)的位置,一頓拖拉拽,幾分鐘就把前端搞定了——
不得不說,這個是真的做到了傻瓜式操作,像導航條切換功能頁、開關、下拉選單、數值輸入框等常規前端元件全都有,配置下按鈕事件就能直接呼叫後端呼叫工作流,這個體驗不要太奇妙。
儘管這個 UI Builder 剛上線不久,但我覺得這是開啟 AI 應用生態的必要環節,有了這個東西后,我們終於不再只有一來一回的對話式互動了。未來的大量 AI 應用,一定像我這個夕小瑤表情包生成器一樣,跳出對話正規化,比如圖生圖、圖文創作、檔案總結等賽道。
至此,一個擁有完整前後端的 AI 應用就這樣做完了!
來,看下效果!
what,開局即王炸嗎??這表情這麼到位的嗎??
繼續!
輸入:害羞,雙手捂臉
愛了!繼續!
輸入:一臉問號
生動!繼續!
輸入:雙手比心
愛..等等,手臂怎麼會這麼粗,大力水手夕小瑤??
再來再來!
輸入:開心大笑,跳舞
這一圈小夥伴也太可愛了叭!(請在公屏上打出請求 C 位出道!
繼續!
輸入:生氣憤怒
等等等等,你剛給我個大力水手夕小瑤我還能忍,這次直接成賽亞人夕小瑤了??
我再給你一次機會!
輸入:哭泣流淚
又可以了!
來,投出你心目中覺得最愛的一個,我用它作為母圖做一個最終的系列出來
我萬萬沒想到,國產 AI 工具釦子竟然用了 20 分鐘解決了我頭疼了好幾天的 AI 需求。
而且這還是隨手一弄,連一行程式碼都沒寫,prompt 也沒調幾版。
我把這個夕小瑤表情包生成器釋出到釦子商店了,大家如果跑出來愛了的表情,記得發到 Family 群裡呀!
夕小瑤表情包生成器:
https://www.coze.cn/s/iUH8RTG4
當然,雖然我現在是釋出到了釦子商店裡,但我在釋出會上驚喜的聽到釦子現在竟然還能直接釋出為微信小程式、抖音小程式和 H5 網頁了!而且升級的文生圖模型可以直接出帶文字的表情了。
等我明天研究下,釋出成小程式後告訴你們!也支援作為模版上架,可以一鍵複製整個應用進行魔改,而且據說釋出模版可以賺錢,這個等我研究好了評論區告訴你們。
實話說,自從我在大會現場把這個表情包生成器做出來後,整個人都注意力集中了!
這個最新版的扣子 1.5 對於 AI 應用開發的完成度實在太高了。重點是,真就解決了連 MJ、DALLE- 3、Image3 都做不好的人物一致表情包生成問題。
我在幾個月前玩過釦子,那時候釦子還是個純文字對話工作流。
如今,釦子的多模態能力升級的實在超出了我的想象,這次大會上新發布的豆包·視覺理解模型、豆包文生圖 2.1 和豆包音樂模型,在釦子也都能透過外掛的方式第一時間體驗到。
甚至,我在會上聽說連超低延遲的語音對話 API 都有了,等我做點好玩兒的語音應用出來後,跟你們分享!
除了釦子外,我覺得釋出會上的火山方舟,也相當有料,有必要跟你們分享一下。

火山方舟:大模型開發的“瑞士軍刀”

先科普一下。
釦子可以讓沒學過程式設計的人也能開發 AI 應用,那麼火山引擎給專業的程式設計師開發者用的大模型開發服務平臺,就是火山方舟
火山方舟剛釋出了一個叫應用實驗室的 feature,我覺得挺有用的。
你可以認為,它開源了一套 SDK 和一些企業場景的示例模板,用於在保證靈活性的同時,高效率開發 AI 應用。
更誇張的是,他們直接把這些東西的完整前後端 Python 程式碼給開放出來了,所以開發者/企業使用者就可以直接像用 github 開源專案一樣,根據實際需求去進一步 DIY 了。
如果你做過非常複雜的 AI 應用,甚至創過業,你肯定知道我在說什麼。這事兒對於適配自己的業務來說是非常 make sense 的。
比如,你要做一個兒童動畫生成的 AI 應用,那麼你既要用到指令碼生成的 LLM 模型,也要動畫角色的影像生成模型、影片生成模型、語音生成模型等、視覺理解模型、語音轉文字等等一系列 AI 原子能力,現在,基於火山方舟的應用實驗室,用它的 SDK 就能在幾分鐘內搞定了。
這時,如果你對裡面一些原子單元的策略細節感到不爽,可以直接深入進去改原始碼…
比如,如果你想要加一段背景音樂,那麼只需要基於已經開源的程式碼,插入幾行音樂生成的邏輯,就搞定了。
這玩意兒相當於別人替你負重前行了 80% 的路,只要按照自己的意願走完成剩下的 20% 你就成功了,以後搞開發前先在火山方舟上找模版,幸運的話你只需要完成 20% 就行了。
除此之外,豆包大模型完成了新一輪迭代,全面對齊 GPT-4o,全新的視覺理解大模型,現在在火山方舟平臺上也可以無障礙呼叫,整個豆包家族的模型,單輪對話、多輪對話 + 工具使用、圖片理解、續寫、影片理解等場景的大模型 API 都囊括其中了。
除了大模型推理、精調、評測等傳統的大模型開發鏈路 API,火山方舟還支援豐富的外掛能力、擴充套件 API 和高程式碼解決方案。
比如位元組系特有的抖音、頭條等海量內容,你都能直接從這上面以外掛的形式呼叫。
這一系列的組合拳之後,我覺得大模型“高程式碼”開發的成本也終於被打下來了。
而且,火山方舟還特別強調了安全性,透過全週期安全可信方案,資料從出使用者域到進入方舟安全執行環境,最後到回到使用者域這個鏈路上,資料在方舟不留痕。
作為一名混跡 AI 圈多年的老司機,這次大會給我的最大的感受:驚喜
不再是模型引數的堆疊和較量,而是這份升級後的開發者體驗,又驚喜又有安全感
想想以前,咱們搞 AI 開發,那可是妥妥的“高門檻”技術活。光是環境配置就能勸退一大波人,更別提什麼模型訓練、部署、調優了,簡直是難上加難。但現在——
人人都能成為開發者
這次火山引擎 Force 大會開發者論壇,就完美詮釋了這一點。從火山引擎總裁譚待的開場演講,到後面各個產品的詳細介紹,都透露出一個核心資訊:火山引擎正在構建一個全棧的 AI 開發生態,讓不同背景、不同技術水平的開發者,都能輕鬆玩轉大模型!
最後,我想用火山引擎總裁譚待的一句話結尾:
“大模型時代,普通人用 AI 也可以探索日月星辰。我相信未來,每個人都將平等地用上 AI 的能力,探索一切未知 —— 這將是屬於全人類的浪漫。”

相關文章