讓微軟真人語音讀金瓶梅可太刺激了!

週一那篇不是分享了微軟語音合成的最新動態嘛。
別的不說了,文章下評論區的一片好評,就足以說明微軟這波操作有多給力。
容我把 AI 生成的語音再貼一遍,還不知道發生啥的小夥伴不妨聽聽看。
簡單說,就是微軟推出了一個主打「逼真」的語音模型,並將在這個月逐步放出。
當時挖了個坑,說是等中文模型多語言曉曉正式推出了,就給大家安排個教程。
但沒想到,上午還在和大家說這個 AI 有多牛逼的時候,中午就已經能用了。
想起有老哥問這麼逼真的語音,能不能讀那種東西。
答案是肯定的,把少兒不宜的《少婦某潔》的文字扔進去,曉曉是真的能讀。
嘿嘿,既然搞定了,那使用教程也就來了。
註冊 Azure
像這種微軟的 AI 服務,說到底是微軟家的 Azure,陌生的小夥伴不妨類比成國內的阿里雲和騰訊雲。
說白嫖,那到底白嫖什麼呢?
其實是微軟雲給註冊 Azure 的使用者,準備了免費額度,其中就有「文字轉語音」的這一項。
按官網的說法,免費服務 30 天 200 美元,等轉為「即用即付」的模式,像文字轉語音的免費額度將永久有效。
即每月不超過標準模型 500 萬字符,神經網路模型 50 萬字符,這個免費額度可永久白嫖。
所以第一步要做的,就是去登入註冊一下 Azure。
地址:azure.microsoft.com/zh-cn/free
大致流程就是——
登入你的微軟賬號,再註冊 Azure 賬號,填寫個人資料,基本搞定。
國內的郵箱、手機號、地址就行,要說有啥注意的,就是出生日期別搞個未成年,免得以後因為這個吃虧。。。
但最後一步有個門檻,就是需要繫結你的信用卡或簽帳金融卡。
這是使用微軟 AI 語音合成唯一的門檻,繫結過程中會扣 1 美元的驗證,驗證通過後再把 1 美元退回。
說白了就是驗證真實使用者,怕被黑、灰產用指令碼白嫖的風控,不是真的扣費。
PS:早些時候看過繫結虛擬卡的操作,理論上現在還支援,但沒研究過,就不多說了。
建立語音服務
等繫結好信用卡,會自動進入到 Azure 的管理後臺,如果沒有跳轉,去 Azure 上登入一下就好。
在管理後臺,我們直接搜「語音服務」。
點進去選擇「建立」,名字什麼都隨便填,需要注意的是區域和定價層。
區域這裡,美國東部、西歐和東南亞這幾個地區可以使用最新的語音模型,我選的是 East US(美東)。
定價層這,一定要選 Free F0,即免費層。
填好這個表格,點選建立並等待審閱、部署就搞定了。
使用語音合成
當上面都配置好了,你可以跟著指示一步一步跳轉,也可以直接訪問語音庫的頁面。
地址:speech.microsoft.com/portal/voicegallery
在一眾語音裡,有個叫「曉曉 多語言」的模型,就是我們的主角。
右側試用有 500 字元的限制,我們點「轉至有聲內容創作」,在下面這個頁面就可以進行文字語音合成了。
具體操作起來,咱就不能用《少婦某潔》舉例了,怕過不了審。
折中一下,我專門去 Z-lib 下了本書。
第一步,先把文字複製過來,可以分好段,方便後續操作。
選中文字,就可以新增配音,可以增加停頓、修改發音、設定語調、增快語速、改變音高音量了。
也就是說,只要你想,你可以弄個情景劇出來,但除了「曉曉 多語言」這個逼真向的模型,別的模型,還是以前的樣子。
比如這個,讓舊版曉曉讀旁白,讓新版曉曉演婦人,讓雲希念武松,模型好壞,高下立判。
有個小技巧啊,AI 生成每個字都是都完整念出的,但結束時就會很生硬,所以不妨在句子末尾加上語氣詞,比如「嗯、啊、哈、了、呢」之類的。
PS:每個字詞的語調都能調整,但這個我是真玩不轉。。。
不過新版曉曉的魅力,就是完成度很高,會根據這些語氣詞進行正確的連句。
算了算了,還是放一個完整的段落,我把週一那篇公眾號文章的開頭交給了新版曉曉。
這個效果,在會微調的玩家手中,絕對以假亂真。
PS:可惜的是,新版曉曉不支援撒嬌、溫柔的語氣風格,如果後面加了,咱到時候再整個活。
結語
對了,之前不是說已經有動手動手能力強的大佬把曉曉接入了自己的播客嘛。
結果我去某寶瞭解了一下,已經有人把微軟 Azure 這個「免費」的新手福利打包出售了。
99 元的定價,已售 800+,emmmm,這執行能力,就真挺厲害的。
既然新版曉曉也是免費放出,估計後面各種 TTS 的軟體 App 也會新增這個模型。
大家可以稍微觀望一下,記得 Pass 掉那種不合理騙錢的。
好了,這就是今天的全部內容了,最後送上曉曉的祝福,大家別忘了順手點個贊啊。

相關文章