發現一個好玩的AI播客生成工具,嗯嗯啊啊實在太像人了….

經常讀咱們文章的小夥伴們,你們是否覺得文字的方式有些枯燥了呢?沒關係,這裡我製作了本文的一期播客,歡迎收聽!
還有愛好寫作或者喜歡聽播客的朋友們,你們是否想過做一檔屬於自己的播客,但又無從下手呢?沒關係,今天分享的這個工具先給你打個樣 ~
最近,語音人工智慧初創公司 ElevenLabs,在他們的 ElevenReader 應用中推出了一個叫做 GenFM 的功能,這個功能能透過我們上傳的內容,快速製作一期由兩名 AI 對話交流的播客。透過給對話加停頓、「嗯」聲和呼吸等人類元素,整場對話非常自然。再結合該公司積累的豐富多樣的 AI 音色,GenFM 功能可以和之前 Google 出品的 NotebookLM 一爭高下了。

適用場景

因為平臺支援各種型別的內容來建立播客,如文章連結、文字、PDF 文件、電子書,甚至還支援上傳 YouTube 影片、一鍵掃描文件,並且生成時間快,所以它的適用場景非常廣,只要你想到什麼有價值的東西,你都可以用它轉換成播客形式,聽兩位 AI 嘮嘮你的好東西。
比如:
  • 讓文字更方便、有趣:不方便看文字的時候,比如上班開車路上、運動等,聽 AI 朗讀又很容易走神,就可以試試把喜歡的文字轉換成播客,先聽聽 AI 的思考。
  • 讓知識更簡單、輕鬆:碰見難啃的知識點,自己一個人學很枯燥,缺少伴兒,又或者想分享一些專業知識,用文字的方式擔心別人理解困難,也可以試試將它們轉化為播客,先磨磨耳朵。
  • 讓播客製作更易上手:自己寫好了文字,讓兩位 AI 打個樣,聊聊文字裡的內容,這樣自己對播客的形式會有更多想象的空間,另外也可以讓 AI 給自己的內容把把關,就把它倆當成內容點評官看待。
這裡我試了下用我很喜歡的播客節目製作一期播客,有點套娃的意思了,下面有請兩位 AI 主播,聊聊「知行小酒館」最近一期關於教育的播客《高考前只管努力,工作後只想發瘋,我們的教育究竟怎麼了?》:
聽聽裡面的語氣詞,雖然他倆的中文不是特別好,但還真挺像外國人說中國話的。
兩位 AI 主播聊得也很深入,確實是理解了原播客的觀點。有幾個亮點值得一提:

生成的播客結構非常清晰

  1. 背景引入:首先引入這個教育機構的成功案例,丟擲話題。
  2. 介紹主體:然後介紹他們的教育理念,幫孩子找我自我,成為一個獨立、完整的人;描述他們的教學內容,比如一些特別的課程,“生死課”、“做事課”等等。
  3. 分析意義:再去理解他們教育行為背後的目的,他們相信當一個人找到自己的興趣和方向時,學習效率會大大提高。
  4. 從另一個角度思考:緊接著又表達出對這種創新的擔憂,畢竟新事物往往具有兩面性,他們的探索不一定適合每一個孩子,但他們提供了一種新的思路。
  5. 從中得到的啟發:分享了一些適合普通家庭的教育建議。
  6. 展望未來:對未來的教育充滿期待,個性化和多元化將是趨勢。

含有豐富的哇、嗯等語氣詞

更令我驚訝的是,他們在對話裡,還很適當地加了各種語氣詞,這讓聽眾可以感受到他們的情緒,一會兒激動,一會兒有所顧慮,沒錯,我感受到 AI 人的情緒了!另外,他們還會在思考的時候停頓,也給了聽眾們一點遐想的空間,代入感滿滿。

提供了完整的逐字稿

雖然講稿還是文字的形式,但兩人一問一答的對話方式讓文字變得生動起來,讀者也更容易進入這個話題,去思考他們的問題。
聽了這個還不過癮,要不我再試試用夕小瑤的技術文章生成播客?如果質量不錯,那以後不就可以用它來生成播客,輔助學習知識了嘛 ~
就用這篇乾貨滿滿的綜述類文章吧:從 CoT 到 Agent,最全綜述來了!上交出品
怎麼樣?(忽略稍微有些出戲的口音和 15 秒位置的奇怪氣泡音)雖然時長不長,但也算是通俗易懂地以一問一答的方式,把 CoT 和 Agent 的概念、原理、應用場景、挑戰以及未來趨勢等等說得非常清楚了。聽了他們的對話,是不是對這些高大上的技術更加感興趣了呢 ~
既然 GemFM 可以讓知識變得更簡單、有趣,還支援 PDF 檔案,此時我又有一個大膽的想法,讓我們再來試試這本當年入門 AI 時啃了很久的西瓜書吧 ~
不是,這個播客更像是兩位 AI 主播在幫周老師直播帶貨,就怕他們最後來一句“123,上鍊接”了,不過他們的帶貨是很很公正的,因為他們不僅聊了本書的結構、內容,還提到了這本書的不足,就是機器學習發展得太快,有些最新的技術沒有覆蓋到。不過沒關係,關注夕小瑤就夠了。
等等,你以為 GenFM 就這些本事了?No,遠遠不止,因為它還可以透過影片生成播客。緊跟時事(本來想發給它麥琳的十大名場面,可惜基於影片的生成目前還只支援英文字幕),我給在 YouTube 上找了 OpenAI 第 3 天的直播錄影發給了它,讓 AI 主播們來聊聊最新發布的 Sora(聽說實測一言難盡,感興趣的可跳轉:別吹 Sora 了,實測一言難盡。甚至分不清人臉和豬??)。
有一說一,GenFM 的英語口語還是地道的哩。
不過沒想到吧!GenFM 不僅能將文字升維成更輕鬆的音訊,還可以把影片降維成更簡單的音訊,以後看影片吃個瓜,還能有兩個伴和你一起嘮嗑,別提有多熱鬧了 ~
GenFM 的應用場景還有很多,我估摸著聰明的小夥伴們心裡早已有了想法,歡迎留言分享你們的播客作品!

後記

AI 火了後,文字總結成為最先被廣泛應用的場景之一。它透過提煉文字內容的核心資訊,幫助使用者快速理解複雜內容,解決了資訊量過載和時間碎片化的問題。然而,這種方式雖然高效,卻在形式上侷限於“吸收資訊”的單向互動,缺乏趣味性和代入感。
而我們今天分享的 GenFM 功能,就打開了另外一條思路:透過對話為主的播客形式,將內容的價值延伸到更豐富的場景體驗中,讓內容更有溫度。
不僅如此,在我看來,對話這種形式,更能復現出內容的產生背景。試想我們寫的文章、論文,難道不都是在一次次自己與自己、與同學、與老師的交流中產生的嗎?如果能用對話的形式,將複雜的內容透過角色間的討論重新呈現,聽眾是不是會獲得更深刻的理解呢?
從文字到音訊,技術的發展總能在意想不到的地方開花,為我們又帶來了新奇的體驗。GenFM 這類創新展示了 AI 在內容互動領域的無限潛力,在未來,AI 技術可能會進一步提升對話的智慧化程度,比如即時生成個性化的播客內容,作為嘉賓直接參與到 AI 的播客互動中,等等。
讓我們繼續保持對 AI 技術的觀察吧,咱們下期再見 ~

相關文章