Suno來了,和全新音樂創作場景一起|ZTalk

Z Talk 是真格分享認知的欄目。
我們在這裡談論最新的行業觀察,先鋒的創業動態,也在這裡與真格老友相聚。我們相信持續的學習和進化,相信最深刻的認知來自實踐。
3 月 22 日,Suno V3 版本正式釋出。Suno 的創作能力如何?又為音樂創作帶來了哪些新的挑戰與契機?在本文中,真格基金管理合夥人戴雨森分享了他對於 AI 音樂生成的思考。
在國內 AI 音樂生成領域,真格基金於 2020 年 A 輪投資的「快音 AI 寫歌」引領了全新的創作場景——專有音色演唱、歌曲電影解說、生日祝福等。我們始終高度關注AI 生成領域的最新進展,並期待與你共享和探討。
3 月 22 日,初創公司 Suno AI 正式釋出 V3 版本,

這一破圈版本被視作顛覆音樂界的 ChatGPT

——

「Suno 正在創造一個未來,在這個未來,任何人都可以製作出很棒的音樂。」

開啟 Suno,使用者只需要輸入想要的音樂風格、主題,或是歌詞,就能在幾十秒內得到 2 首時長 2 分鐘的歌曲,和一張音樂封面。與前代相比,Suno V3 可以生成更高的音樂質量、更多樣的音樂風格與流派、對 prompt 理解更準確、幻覺也更少。
免費使用者在 Suno 每天可獲得 50 點數,用於 5 次生成,每次 2 首,一共可生成 10 首歌曲。如果每月支付 8 美元,即可生成 500 首;每月支付 24 美元,可生成 2000 首。Suno 尊重音樂創作者與智慧財產權,因此不允許使用者在 prompt 中請求使用特定音樂人的風格與聲音。
圖片來源:Suno 官網
據「定焦」,Suno 背後主要由自研的兩個大模型支撐,分別是基於 transformer 的 Bark 語音模型和 Chirp 音樂模型,前者主要用來生成人聲,後者提供音樂旋律和音效。兩者讓 Suno 生成的音樂旋律更智慧化、複雜化,這也是這家公司的核心技術。
Suno 成立於 2022 年 3 月,位於麻省劍橋,團隊只有 12 人。Suno 最早的投資者之一是 Antonio Rodriguez,Matrix 風險投資公司合夥人。
據「滾石」報道,創始人 Mikey Shulman 是一個「有著少年魅力、總是揹著雙肩包」的 37 歲哈佛物理博士畢業生。他的想象中,全球會有十億人,每月向 Suno 支付 10 美元來創作歌曲。目前音樂聽眾的數量遠遠超過音樂創作者,在他看來是「如此失衡」。
Mikey Shulman
Shulman 本科就讀於哥倫比亞大學的應用物理專業,輔修應用數學。2009 年畢業後來到麻省劍橋的哈佛大學攻讀物理 PhD。2015 年,Shulman 博士畢業,加入了 AI 創業公司 Kensho Technologies——專注於以 AI 為金融業提供高階分析和預測解決方案。2018 年,Kensho Technologies 以 5.5 億美元被 S&P Global 收購。
在 Kensho Technologies,Mikey Shulman 與另外三位聯合創始人——Georg Kucsko, Keenan Freyberg, Martin Camacho 相遇,並一同在 Kensho 工作至 2022 年。他們在 Kensho 的主要工作內容是開發一種 AI 語音轉錄技術,用於轉錄上市公司的財報電話會議。
AIGC 浪潮之中的音訊遠落後於影像與文字。在意識到這一點後,Suno 團隊於 2023 年 4 月釋出了基於 transformer 的文字轉音訊模型 Bark,並在 Bark 早期使用者調研中,發現使用者真正想要的是音樂生成工具。「所以我們開始進行一些初步實驗,結果很不錯。」
Shulman 和 Camacho 都很喜歡音樂,在 Kensho 時經常一起即興演奏。許多 Suno 的成員也都是音樂家,辦公室放著鋼琴和吉他,牆上也掛著古典作曲家的畫像。Suno 的官網上寫著,「我們喜歡寫程式碼,創作音樂,喝咖啡。音樂和聲音實驗是我們公司文化的全部——從午餐閒談到辦公室的錄音棚。」
圖片來源:Suno 官
對 AI 音樂的未來暢想
真格基金管理合夥人戴雨森:Suno V3 有點像 Midjourney 的 V3、GPT 的 3.0 版本,給音樂產業帶來了很多變化的可能,這裡簡單暢想一些可能的方向。
UGC 音樂平臺
之前做音樂 UGC 平臺的公司基本都沒有起來,一個重要原因是,音樂是創作者頭部效應最明顯的產業之一。
一個普通人拍的影片可能是具備消費價值的,因為拍攝的人、事、景等可能很有意思,但是普通人創作的音樂、或者翻唱的歌曲幾乎是完全不具備消費價值的。實際上,我們日常在聽的、耳熟能詳的、能出圈的歌曲也就是萬首的級別。因此,控制了頭部創作者的三大唱片公司,一年的版權收入是幾百億美金。天下苦三大久矣。
現在以 Suno 為代表的 AI 作曲工具的出現,突然極大地降低了創作一首 60-70 分音樂的門檻。這有點像攝影的發展:一開始要用膠片拍攝和沖洗,然後誕生了數碼相機和 Photoshop。門檻進一步降低,攝影工具變成了手機攝像頭和剪映。當大量的普通人突然可以按照自己的想法、歌詞,來生成達到及格線的音樂時,就可能會隨機誕生出全新的音樂家和大作。
與此同時,Suno 也是 AIGC 應用裡難得可以形成「內容生產者 + 消費者閉環」的平臺。妙鴨相機和 Midjourney 這類 AIGC 工具的長期問題,都在於 AI 產生的內容在本平臺上的再消費價值不足。用 Midjourney 生成的圖片,一般來說只對生產者本人有價值。作為內容消費者,人們很難去刷 Midjourney 或是妙鴨的內容廣場。
但是,用 Suno 生成的音樂則不一定。事實上,我發現自己很自然地就在 Suno 上開始聽推薦的音樂了,有的還真的有點意思——這首最近在 Suno 排行榜第一名的中文搖滾就還真的挺好聽的!
個性化音樂
70 分的音樂單獨欣賞的價值並不大。因為絕大多數情況下,使用者總可以去聽 95 分的佳作,甚至單曲迴圈最好的那首歌。
但 70 分的音樂,配合合適的場景可能是有用的,尤其是可以隨時生成個性化歌詞音樂的時候。一種常見的場景是作為生日禮物,活動物料等。另外,配合影片等內容也可能產生有趣的玩法。
來源:B 站 up 主 @唐僧說電影,《心驚膽戰》
這是一個 up 主使用「快音 AI 寫歌」創作自定義音樂來點評電影的例子。在這裡,音樂本身是否好聽其實並不是那麼重要,重要的是用帶有韻律的方式來傳達資訊。
罐頭音樂生成器
有一些場景下,70 分的音樂也是可以接受的,比如說公共場合的背景音樂等。
想起小時候有個不存在的樂隊叫「班得瑞」。實際上,班得瑞」是臺灣一個樂隊公司把很多風格類似的器樂包裝在一起,出了很多專輯,一度很流行。
而 Suno 現在生成的純器樂質量已經不錯了,作為日常咖啡廳的背景音樂也完全不覺得違和。這可能是因為沒有人聲的器樂更加接近純數學,AI 能夠更好地生成。
例如,這首曲子就很「班得瑞」:
https://app.Suno.ai/song/a0f12ca5-0833-49ce-97f1-cd6094510f2c
音樂人的 Copilot
就像我們不會要求 ChatGPT 直接寫出來一部小說一樣,現在對 Suno 的要求也不應該是直接生成一首完整的歌,而是作為再創作的起點。
Suno 可以首先作為音樂創作者的 Copilot。看起來,這裡的難點是如何生成專業創作者需要的工程檔案(和 3D 生成遇到的問題類似),並且如何在一致性和可控性上進一步提升,需要類似圖形生成裡面 LoRA 和 ControlNet 這樣的技術。
現在用 Suno 生成一首歌之後,再 remix 得到的結果就完全不一樣了,但還是會經常出現「這首歌聽起來不錯,但是我還想微調一下」的場景。相信這個是可以很快得到提高的。
總之,現在的 Suno V3 比起之前所有的 AI 音樂創作工具都有長足的進步,可以說是第一次摸到了合格歌曲輸出的門檻。但是,Suno 也在音樂質量、一致性、可控性等方面,有許多顯然可以大幅提高的地方。
這很像 GPT3 推出時,是第一個讓人覺得「這次真的不一樣了」的版本,而 GPT-4 完成了大幅提高,變得更加實用高效。期待在 AI 音樂生成領域,我們能夠看到更多的驚喜。
AI 為音樂創作帶來了哪些全新場景?
快音在 2023 年推出的微信小程式「快音 AI 寫歌」,為音樂創作帶來了更多想象。
和 Suno 一樣,開啟快音,輸入靈感或一段歌詞,就能得到一首屬於你的 AI 歌曲。快音還支援多次修改編輯歌詞,也可以新增具體人名送給指定物件。如果清唱 60s,還可根據你的聲音訓練出你的專有音色。
目前,快音 40% 的付費使用者用於市場營銷,為自己的產品寫歌,30% 的使用者會用於 KOL 內容創作,30% 用於各種祝福和紀念場景——「送你一首生日祝福」。
快音還帶來了一個全新的出圈場景——用歌曲解說電影。根據電影劇情生成歌詞,再將歌詞輸入「快音 AI 寫歌」,選擇相應曲風,即可生成一首帶感的背景音樂。B 站 up 主 @唐僧說電影釋出上文中的影片《膽戰心驚》後,觀看量超過 150 萬。
快音成立於 2019 年,是專注 UGC 內容生產力的音樂平臺。2020 年,真格基金 A 輪投資快音。在文字和影像大模型飛躍後,快音開始嘗試將 AI 大模型和音樂進行結合,並推出了微信小程式的「快音 AI 寫歌」。
相比文字、影像,音樂的創作環節更多、更復雜,要考慮詞曲一致,也要考慮到混響、降噪等後期處理。同時,高質量音樂資料集較少,標註成本大,需要很多前置工作。快音透過模型輔助人工標註,模型識別準確率可以提升至 85%,人工達 95%,人效提高 10 倍以上。
文|Yusen & Wendi
推薦閱讀

相關文章