零失誤的AI主播上崗,但主持人被取代還為時尚早

「地球不爆炸,我們不放假」,這話出自央視主持人朱廣權。當時臨近 2017 年農曆新年,談到「你們電視臺放假嗎」的問題,他一本正經地講了個段子。
但 8 年後,主持人真的可以在春節放假了。負責代班的,是和他們長得差不多的 AI 主播。
影片擷取自《杭州新聞聯播》
AI 假期代班,真人過年回家拍短影片
誰能想到,傳統的電視節目,以一種很新的方式出圈了——蛇年春節期間,除夕至初七,《杭州新聞聯播》節目讓 6 位 AI 主播值班。
每天,各有兩位 AI 主播出鏡,輪流口播,形式很像日常的新聞節目。
圖片來自:公眾號「杭州綜合頻道」
AI 主播倒也算不上新鮮事,2024 年龍年春節,它們就已經登上了《杭州新聞聯播》,但當時只有 2 位 AI 主播,形式是單播。
動圖製作自:影片號「杭州綜合頻道」
除了地方臺,AI 主播也已經出現在了更大的舞臺上。央視的《2024 中國·AI 盛典》,主持人尼格買提以數字人的形象出現,恰好他所討論的,就是 AI 會不會取代人類的話題。
網上也不乏一些這樣的聲音:AI 上崗,真人主播過完年還有班上嗎?從《杭州新聞聯播》的影片看,AI 主播們雖然吐字清晰、不會出錯,但表現還差點意思。
理由包括但不限於:語氣欠缺了感情,特別是祝觀眾朋友新年快樂的時候,有些呆板。雖然會眨眼和輕微搖晃腦袋,但動作幅度很有限,脖子以下基本不動。淺景深的虛化效果,摳圖感重,背景看起來有些假……
圖片來自:《杭州新聞聯播》
播音主持專業畢業、目前從事產品評測編輯的 Obo,以更專業的角度提出了幾點意見:
語流語勢比較平,起伏不夠,所以還是能聽出來機器人的機械音。
句末的字尾歸音不到位,有一種戛然而止的感覺,突然停下有些突兀,不自然。
取樣主持人的聲音壓嗓嚴重,胸腔共鳴被嚴重的壓喉影響,聽感一般。
副語言不到位,和新年掛鉤的新聞,表情卻是嚴肅的,播報內容和臉部副語言脫節。
所以他認為,目前 AI 還無法代替真人主持,「AI 數字人出現挺好的,不用調休了,而且我已經跳出來了」。
但更廣泛的電視觀眾們,不會這樣認真「找茬」,可能認不出 AI。其實,真人主播暫時不會被替代,還有一個原因——AI 主播負責播音,那麼真人就可以有時間做更多的事情了。
部分真人主播的短影片截圖
《杭州新聞聯播》AI 主播的形象、聲音,是以真人主播為藍本的。真人主播們回家過年,還不忘拍攝「主播尋年味」系列短影片,介紹家鄉的風土人情。以及,和其他打工人一樣,他們初八還得回去上班。
Obo 雖然已經不在播音行業,但他在電視臺工作的大學同學們,同樣有播報日常新聞之外的任務,平時需要策劃一些整活向的、年輕人愛看的短影片,過年也被要求拍攝 Vlog。
傳播渠道的更迭是一個原因。比起電視節目,短影片不會那麼官方和正式,更能拉近主持人和觀眾的距離,同時也提供了以小見大的視角,讓資訊更加容易傳播,甚至打造出主持人的個人 IP。
但也很難說,其中沒有 AI 的影響。看到杭州 AI 主播上崗的新聞後,Obo 和同學們聊起播音主持的未來,他們得出一個結論:「播音員當然會被取代,主持人不會。」
當日常節目可以漸漸由 AI 完成,工作效率直接被 AI 提高,「採編播」裡的「播」,顯得越來越「不重要」了。但這個「播」是狹義上的,是指天氣、交通等「功能性」的播音,像朗誦這樣更具藝術性的表達形式,缺乏標準,也更難被取代。
AI 解放了人類主持人的節假日,也倒逼著主持人在播節目之外掌握更多技能,空出時間做更多的「雜活」,扛攝像機、做編輯、寫稿子、主持大型線下活動……總之,「主持人的職場空間會被壓縮到跟記者一樣」。
不嫌苦不怕累的數字人,已經到處都是了
AI 主持人,只是數字人上崗的一種形式。最近,香港大學與字節跳動合作研發的、專為廣告影片設計的豎屏 Goku+ 模型,雖然還沒能用上,演示效果也令人瑟瑟發抖。官方甚至表示,「以低 100 倍的成本製作廣告影片」。
僅透過文字提示詞,Goku+ 就能生成逼真的數字人影片,時長可以超過 20 秒,面部表情、手部動作、身體移動都很自然。
不僅如此,基於文字提示詞和產品圖片,Goku+ 還能生成數字人和產品互動的影片。
但也不用過度焦慮,AI 數字人的作用,目前來說還是單一的。2023 年 9 月,我們寫過直播間 24 小時工作的 AI 主播。它們的優點顯而易見,便宜、形象可控、掌握多國語言、不嫌苦不嫌累不情緒崩潰。
當時我以買家身份諮詢了一家數字人公司,按照真人形象定製數字人,基礎版 8000 元一年,高階版 3 萬一年,訓練素材稽核通過後,訓練 2 個工作日,平臺就能反饋訓練成果。
定製形象是一方面,數字人直播是另外的價錢,5500 元一月。我在今年 2 月又諮詢了一次,直播還是這個價,支援三種開播方式:自動播,使用提前準備好的直播語料,語音或者文字;阿凡達直播,使用麥克風,真人即時驅動數字人的口型;自動播結合阿凡達直播。
但這家數字人公司,不對效果打包票,「數字人主播僅能替代部分機械化主播的工作,運營崗位相關工作替代不了,所以不承諾任何效果……效果和你的產品、直播內容、拉流量的手段等因素息息相關」。
而且因為數字人的表現仍然和真人有差距,它們也沒必要一直站在臺前。就像 AI 主持人更適合在假期等非黃金時段代班,直播間的 AI 主播也更適合出現在「垃圾時間」,用來衝直播時長,或者時長 12 到 24 小時的本地生活直播間,拿重複的話術轟炸。
但這不意味著,數字人對真人沒有傷害。Obo 認為,AI 主持人可能會讓一些播音主持新人失去在「垃圾時間」練嘴的機會,然後影響到他們的就業渠道。同樣,先被 AI 直播波及的,會是那些海量的、不知名的、月薪幾千、投資回報率更低的「小透明」。
AI 越擅長模仿,人類越強調在場
《杭州新聞聯播》AI 主播出圈之後,微博上的一個熱搜詞條是這樣的:AI 播報 0 失誤,播音專業學生怎麼辦。
這就說明了一部分人的觀點:AI 能代替真人,是因為它不出錯。或者更泛泛而談,AI 能代替真人,是因為它身上「不人性」的一面。
但這個觀點其實恰恰違背了人性,大眾喜歡看到平時端正嚴肅的主持人身上,不那麼日常的、更接地氣的部分。
主持人出錯合集的花絮,因為滿足了觀眾的惡趣味,很容易在影片平臺走紅。更有代表性的例子是,在一次《新聞聯播》中,主持人康輝口播了 20 多分鐘,被推上了熱搜,他的聲音始終保持高度的專業水平,但更讓觀眾記憶深刻的,可能是他播到最後微微泛白的嘴唇,這是一個專業能力頂尖的人類努力的痕跡。
哪怕 AI 可以達到真人的水平,嘴皮子很快,始終不嘴瓢,但那會被認為是理所當然,只有人類肉身完成的,才更容易被記住和在乎。
有時候,這種樸素的、要求人類在場的想法,會逆轉技術的潮流。2024 年 10 月,一個波蘭廣播電臺叫停了用 AI 代替人類的實驗。
在實驗開始的幾周前,電臺辭退了十幾位記者,然後在 10 月推出了三個 AI 主持人,以吸引年輕聽眾。很快,一位前電臺記者和影評人發表了一封公開信以示抗議,「經驗豐富的媒體從業者不該被機器取代」。
超過 2.3 萬人追隨了這位記者並簽署了請願書,還有數百人給記者打去電話,其中許多是年輕人,他們不想成為這場實驗的物件。
本來這場實驗要持續 3 個月,但一週左右就暫停了,電臺對大眾的情緒反應感到「非常意外」。其中可能有些「物傷其類」的意味。AP 的報道里寫上了這樣一句話,「在波蘭各地,人們感到憤怒」。
當我和 DeepSeek 聊 AI 主播的話題,它給了我一個很有意思的觀點——AI 主播模擬人類點頭、眨眼的動作,試圖營造「在場感」,但其本質仍是「去身體化」的技術存在,導致 AI 無法實現人類主持人的「具身傳播」,無法表達身體和情感的自然共振。
很難說 AI 數字人未來會取代多少崗位,但此時此刻面對 AI 主播時湧起的猶豫和遲疑,不管是出於被取代的恐慌,還是因為相信 AI 無法模擬人類的情感,本質都在表達,我們希望人類在場,儘管這可能只是我們的願望。
所以,讓真人主持人在不播節目的時候拍短影片,實在是一個太有趣的走向了。AI 可以取代強調功能性、程式化的部分,但它沒法解答有沒有人願意觀看節目的問題。那些表達煙火氣息的瞬間,那些更容易傳播的片段,仍然需要人類親身的參與。不再強調效率的時刻,人的在場,就是最重要的前提。

我們正在招募夥伴
📮 簡歷投遞郵箱[email protected]
✉️ 郵件標題「姓名+崗位名稱」(請隨簡歷附上專案/作品或相關連結)
更多崗位資訊請點選這裡🔗

相關文章