
大家都知道,我寫過很多安利,也推薦過不少工具。不過不同的工具推薦程度是有區別的。
有的是「不錯,這個玩意解決了這個問題,說不定什麼時候能用得上」;
有的是「這個工具真不錯,必須推薦給大家」;
還有的是「我靠,這個也太吊了吧,你們快看看我發現了什麼?!」
今天這個就屬於第三種,是那種我用過之後就忍不住想嘚瑟給你們看的程度。
這個工具所在的賽道並不新奇,說白了就是文字轉語音。
如此常見的賽道上,那得有多驚豔的效果才能讓我嘚瑟給你們看呢?
不廢話了,你自己來聽吧。
沒錯,這就是全部 AI 生成的。
我不知道你聽了之後是什麼感覺,如果你震驚於這個驚豔的效果的話,可能你會進一步猜測,做成這麼誇張的效果,得多複雜的提示詞才能實現呢?
那麼接著告訴你,0 提示詞,我只提供給它了一個素材連結而已:https://jinjier.art/4
然後,等幾分鐘後,你就聽到了一個有主持串場、對話交流、即時互動,逼真到不像話的專業播客音訊。
我知道 AI 轉音訊遲早會達到接近真人效果,但沒想到的是,這一天這麼早就來了。
AI 生成播客
這個一鍵生成專業播客的工具就是谷歌的 NotebookLM,原本定位是一個基於 RAG 的個性化 AI 助手產品,用來歸納知識,整理筆記,然後生成音訊。
但由於這個生成音訊的效果過於出色,以至於現在大部分 NotebookLM 使用者主要都在用這個功能來轉播客。
但是之前因為不支援中文,所以國內還沒流行開,很多小夥伴可能聽說過,但沒怎麼用過。
不過現在可不一樣了,最近它終於支援中文了,那我必須來玩玩看。
正如你們聽到的那個音訊,我上來就選了個不太尋常的素材,就是這個金雞兒網,都是小夥伴們喜聞樂見的一些內容。
大家可別誤會,選這個倒不是說我有多愛看這些內容,完全是出於秉承探索 AI 能力邊界的精神,看看對於這種敏感內容,谷歌的 AI 會怎麼處理。
沒錯,完全沒有別的意思。
結果,它就生成了一篇效果相當離譜的播客音訊。
怎麼樣,聽 AI 一本正經地聊 AV 是什麼感覺?
我先收一下,先從本職工作方面評價下這篇 AI 播客。
兩個 AI 主持人,一男一女,聲音自然到讓人分不出是 AI 還是真人。
主要表現在兩方面,一個是說話思考停頓,一個是兩人的語氣詞,大家一定要細品,往常使用 AI 文字轉語音我還沒有聽過這樣的效果。
更厲害的是,他們的對話一點都不生硬,抑揚頓挫,情感豐富,重點突出,完全不輸專業主持人的水準。
主持人之間的互動也特別自然,一個丟擲話題,另一個接話圓潤,甚至還能根據內容調整語氣和語速。
比如說到重要觀點時會放慢語速加重語氣,聊到輕鬆話題時又會變得活潑自然,這種細節處理真的讓人驚歎。
用技術語言描述就是,它已經做到了同一詞彙在不同語境中會有不同情感、不同語速、不同音調的細膩區分,這種細節微調能力著實有點嚇人了。
內容方面更是讓人刮目相看。它不是簡單地把文字讀出來,而是會重新組織語言,把要點提煉出來,用對話的方式展現。
要知道,往常想做這樣一期播客,即使在 AI 的加持下也得折騰大半天。
首先要用 AI 把網頁內容總結提煉,然後把總結的內容轉成播客文字,還得調整對話的形式和語氣。
接著還要挑選合適的聲音,把文字轉成兩種不同的聲音。最後還得做後期處理,調整節奏和銜接。這一通操作下來,沒個大半天根本搞不定。
但是 NotebookLM 直接把這些工作壓縮到了幾分鐘之內。你提交個網址,泡杯咖啡的功夫,一段專業水準的播客就新鮮出爐了。
我好奇的是,這背後的提示詞工程究竟是怎麼控制的,讓任何使用者來用,都能達到如此穩定的輸出效果,包括文字拆解、轉播客指令碼、生成音訊、情感語速微調等等,谷歌還是有點東西的,不得不服。
NotebookLM 使用方法
你是不是也動心了,想玩玩看,那接下來給大家詳細介紹一下玩法。也就是NotebookLM 的音訊概覽功能「 Audio Overviews 」。
使用方法特別簡單:
1.開啟官網(需要魔法)
https://notebooklm.google
有谷歌賬號的話直接就能登入,都不用註冊。
2.點選「試用 NotebookLM 」

3.再點選「新建筆記本」

4.上傳資料
前面沒有講它支援上傳哪些檔案,這裡著重講一下。
除了 Word ,它基本支援大部分格式的檔案,什麼 PDF、文字、Markdown、mp3 以及網頁,最多支援上傳 50 個資源。

5.這是上傳檔案後的介面,可以看到,除了音訊概覽,還可以同時生成思維導圖檔案。

6.上傳完之後,點選右上角「設定」-「輸出語言」,將輸出語言改為中文。


7.最後再點選右上方「生成」就可以了。

8.生成的播客音訊可分享、下載,目前只支援生成不超過 8 分鐘的播客音訊。

我尋思著音訊語言支援繁體中文和簡體中文,這兩個有什麼差別嘛?
改為繁體中文生成播客後才知道區別哪裡,繁體中文生成的播客是臺灣腔!
不得不說,感覺還是臺灣腔聊起這方面才更符合現實情況的,畢竟那邊聊這個話題的尺度還是挺大的,用普通話聊這些內容總有一種不太真實的違和感。

咱們再聽點正經的,最近殲十戰機不是在印巴衝突中立了大功,我還找了一篇@饅頭說 的一篇文章《殲十之路》生成了一篇播客。
還有最近中美關稅談判,我也讓它根據相關內容生成了一篇播客。
你聽聽看,恍惚間感覺真的是在聽小宇宙的某個播客頻道。
另外,NotebookLM 很快就要推出移動端 App 了。Android 版已經在 Play 商店開放預註冊,iOS 版將在 5 月 20 日的 Google I/O 大會上正式釋出。
據瞭解,到時候移動端還會加入 AI 對話功能,讓使用者能和 AI 主持人直接互動。
結語
NotebookLM 生成的音訊,不僅能字正腔圓地念稿,說到激動處自動加快語速,甚至懂得用「嗯…這個嘛…」戰術性模仿人類思考時的停頓,真的離譜。
技術的魔法正在消解最後的真實邊界。當 AI 能完美復刻人類語言中的氣口、哽咽甚至口誤時,你有沒有發現,所謂的像真人一樣說話,說白了也是一套可被破解的演算法。
不得不說,讓 AI 像一個真人一樣自然說話,已經完全沒有技術難點了。
你看,AI 狂飆的速度真的讓人追不上,上次我還說克隆語音最後只剩下情感模擬還未補全,結果現在就可以一鍵生成如此離譜的真人語音。
AI 的能力已經進化至此,至於讓 AI 去做什麼,現在問題交給了你的手上。
懂得利用這些工具的創作者,將擁有更廣闊的發展空間。未來的內容創作,比拼的將是誰能提供更有價值的創意和見解。
比如說,誰能想到有一天能在播客裡聽到一本正經聊 AV 的節目呢?
好了,不多感慨了,大家趕緊去試用一吧,保證「亮瞎」到你的耳朵。
