數字人聊天更自然，影像調焦能預防近視|6月網際網路專利盤點

作者|肉丁

網際網路企業的專利申請背後，往往藏著全新的產品佈局思路。這幾年，虛擬人、元宇宙、AI等概念的興起之前，都伴隨著大廠批次申請相關專利的動作。

因此，關注專利的佈局方向，有助於外界預測未來1-2年可能落地的技術方向。還有一些專利和遊戲新玩法、降本增效、企業社會責任等關係密切。

《娛樂資本論》的月度專利總結欄目，關注網際網路大廠每月在專利方面的舉動，對影片、音訊、虛擬人、廣告等領域進行相關技術溯源，追蹤科技賦能商業的全過程。

音影片相關

阿里巴巴：

根據表情變化更改面部影片編碼

專利申請方：阿里巴巴

專利名稱：面部影片編碼方法、解碼方法及裝置

2025年6月27日公開

圖片和影片的有失真壓縮原理是，畫面變動幅度小的地方節省空間，變動大的佔用空間更多。這個方法優化了計算畫面變動大小的方式，特別是針對人的面部表情而言。影片裡表情變化大的地方能被精細保留，變化小的地方就用演算法推算，既節省儲存空間、又能讓還原後的面部影片超清晰。

騰訊：

音訊暫停後續聽不卡殼

專利申請方：騰訊

專利名稱：音訊節目內容的播放控制方法、裝置、裝置和儲存介質

2025年6月6日公開

就像追電視劇時每集開頭會先播“前情回顧”一樣，這個專利就是把這個功能搬進了音訊播放裡，而且是“按需觸發”——只要暫停後再繼續聽，就自動播放定製化的回顧內容，讓聽歌聽書更順暢、不卡殼。

騰訊：

音畫同步檢查

專利申請方：騰訊

專利名稱：音影片同步檢測方法、裝置、電子裝置、程式產品、介質

2025年6月20日公開

將待測影片的人聲音訊和人臉影片按預設時長分割成片段，並檢測特徵。如果某段的口型“對不上”，就判定存在音影片不同步，從而可定位問題並修改補檔。

騰訊：

用歌詞和樂譜教AI唱歌

專利申請方：騰訊

專利名稱：音訊合成方法、裝置、計算機可讀儲存介質及電子裝置

2025年6月24日公開

去年教ChatGPT等語音模型唱歌一度成為熱門話題。這個音訊合成方法先提取目標歌詞的文字特徵和目標樂譜的樂譜特徵，讓演唱模型弄懂每個字唱的時長，最終合成對應歌詞和樂譜的歌聲音訊，既能保證發音穩定，又能透過分層訓練增強自然度和表現力。

小米：影片結尾音樂搭配

專利申請方：小米

專利名稱：內容配音方法、裝置、電子裝置、介質及程式產品

2025年6月27日公開

使用者給影片配音時，系統會先據影片內容找到一段合適的參考音訊，並會從參考音訊裡截取出一段能剛好在影片結束時播完的收尾音樂，就像電影結束時片尾曲的節奏總能和字幕滾動同步，讓情感與畫面完美結合。

遊戲相關

網易：

根據遊戲習慣自動生成角色

專利申請方：網易

專利名稱：遊戲角色的生成方法、裝置和電子裝置

2025年6月10日公開

系統先在使用者過往遊戲賬戶的操作記錄中，提煉出如攻擊頻率、團隊協作傾向等性格引數，接著根據這些密碼自動生成角色，連角色臺詞語氣和外觀細節都與使用者遊戲風格深度繫結。讓使用者省去手動捏臉選職業的繁瑣，減少違和感、增強代入感。

騰訊：

有限元素玩出無限戰術可能

專利申請方：騰訊

專利名稱：遊戲資料處理方法、裝置、裝置、介質及程式產品

2025年6月13日公開

在對戰介面裡，每個玩家能選的遊戲元素總量和強度總值被系統鎖定，但可以自由搭配組合，系統會像裁判一樣記錄每個人的策略配方，最後根據對戰結果結算勝負。這種“資源總量卡死，策略空間放開”的設計，讓遊戲從“堆數值拼戰力”變成“玩套路比心機”，強化了博弈感。

騰訊：

遊戲無特效也能體驗真實水感

專利申請方：騰訊

專利名稱：虛擬角色的控制方法、裝置、裝置、儲存介質及程式產品

2025年6月17日公開

當玩家控制角色走向河流時，系統會即時對比角色視角高度和水體高度，根據這兩個數值自動匹配蹚水、游泳等互動方式。即使沒有複雜的水體渲染特效，也能透過視角高度變化和預設互動邏輯，讓玩家彷彿真的在水中移動，讓第一人稱水體互動從“貼圖式走過”變成“沉浸式體驗”。

米哈遊：

動畫角色擁有真實物理反應

專利申請方：米哈遊

專利名稱：一種虛擬角色的資訊處理方法及系統

2025年6月17日公開

虛擬角色在虛擬世界中活動時，系統會先觀察周圍環境並記錄角色的每個動作，根據環境狀態自動調整動作軌跡，讓角色動作像真人一樣有真實的動作反應。虛擬角色不再按固定指令碼移動，而是能根據環境“活起來”。

完美世界：遊戲對話擁有電影級運鏡

專利申請方：完美世界

專利名稱：對話鏡頭的管理方法、裝置、電子裝置和可讀儲存介質

2025年6月24日公開

當遊戲中多個角色開始對話時，系統會先獲取對話指令碼再分析角色站位，然後像專業導演一樣根據場景和臺詞匹配最佳鏡頭，按“角色位置+劇情氛圍+臺詞重點”三要素自動生成運鏡方案，讓遊戲對話場景升級為電影級鏡頭語言。玩家既能看清每個細微表情，又能感受鏡頭切換帶來的沉浸感。

AI相關

愛奇藝：

智慧拆解與彙總的劇本大綱

專利申請方：愛奇藝

專利名稱：一種劇本大綱提取方法、裝置、電子裝置及儲存介質

2025年6月20日公開

以前人工提煉劇本大綱得逐字逐句讀完整個劇本。現在這個方法可以先把長劇本拆成一個個小部分，讓大模型逐個分析這些小部分，快速提煉出劇本梗概，最後直接生成整個劇本的大綱，省時省力還精準。

百度：

剪輯效率翻倍工具

專利申請方：百度

專利名稱：影片處理方法、裝置、裝置以及儲存介質

2025年6月24日公開

當用戶想為影片新增素材時，點選“素材推薦”按鈕，系統會先提取影片中的音訊並上傳到伺服器，伺服器瞬間將音訊轉成字幕，根據字幕關鍵詞秒級推薦匹配的素材組。使用者從推薦結果中挑出心儀的素材組，AI就會自動生成帶新素材的第二影片。省去手動翻找素材的麻煩，讓剪輯效率翻倍。

阿里巴巴：

商品頁面自動生成影片

專利申請方：阿里巴巴

專利名稱：影片生成方法及裝置、宣傳型別影片生成方法及裝置

2025年6月6日公開

近期，亞馬遜、Meta等紛紛公佈了使用AI將產品圖一鍵生影片的營銷工具。阿里的同類專利把圖片、文字介紹等商品資料收集起來，給每個素材打上“價格”“外觀”等標籤，然後按標籤規劃好產品圖、功能和價格的展示順序，把素材按這個順序拼起來，生成宣傳影片。

百度：

AI替你記網課筆記

專利申請方：百度

專利名稱：影片筆記的生成方法、裝置及電子裝置

2025年6月13日公開

百度網盤是網課使用者重度使用的工具，有時要邊聽課邊記筆記。這個功能把螢幕分成影片播放區和筆記處理區。AI會自動識別字幕裡的關鍵臺詞，即時生成待處理的筆記內容，使用者也可以手動編輯AI筆記草稿。

嗶哩嗶哩：

直播暫停後不錯過精華

專利申請方：嗶哩嗶哩

專利名稱：直播內容展示方法和裝置

2025年6月3日公開

說到上網課B站也不甘示弱，這個功能在使用者看直播時暫停後，會錄下暫停期間的直播聲音，並自動轉換成文字。等點選繼續播放時，螢幕上會彈出這段文字速記，使用者不用回看就能秒懂剛才錯過的內容。

數字人/元宇宙

百度：

AI質檢數字人影片

專利申請方：百度

專利名稱：影片生成方法、數字人的展示方法及裝置

2025年6月3日公開

先拍一段數字人跳舞、說話等原始影片，然後讓“AI質檢員”一幀一幀檢查畫面裡數字人的動作，挑出完全符合預設的畫面，用這些精選的鏡頭剪成一段精準又流暢的影片。

網易：

增強虛擬角色聊天真實感

專利申請方：網易

專利名稱：用於與虛擬角色互動的方法、客戶端、伺服器、儲存介質以及電子裝置

2025年6月20日公開

透過大模型的語音合成引擎，讓虛擬角色聲音帶語氣變化；而3D形象的微表情動作庫，包含眨眼、點頭等表情，使用者說話時會即時歪頭傾聽，彷彿真的隔著螢幕和朋友聊天。系統會先讓使用者選擇語音還是影片聊天，以避免同時載入功能造成的卡頓。

嗶哩嗶哩：

直播間互動任務智慧匹配

專利申請方：嗶哩嗶哩

專利名稱：直播間互動任務處理方法、裝置及計算裝置

2025年6月6日公開

當觀眾在直播間發起互動任務並設定獎勵時，系統會先核定任務的難度，比如唱歌時長、歌曲複雜度等，根據難度給出推薦獎勵。接著對比觀眾設的獎勵和系統推薦的是否匹配，如果匹配，任務就會被接受，這也讓主播更願意接任務。

公益民生

榮耀：

調焦防近視

專利申請方：榮耀

專利名稱：影像顯示方法、影像顯示裝置、電子裝置和儲存介質

2025年6月20日公開

為避免使用者長時間用眼導致近視加深，系統把正常清晰的圖片故意“調焦模糊”，生成一張類似近視眼看東西的朦朧畫面，當用戶看這張圖時，眼睛會自然調整焦距去“對焦”，這種輕微的離焦狀態能讓眼球保持彈性。

騰訊：

車內空氣即時調節淨化

專利申請方：騰訊

專利名稱：車內空氣質量的調節方法、裝置和儲存介質及電子裝置

2025年6月13日公開

當車輛行駛時，系統透過攝像頭觀察車外環境，用影像識別技術從畫面中分析出空氣中的汙染物濃度、粉塵顆粒等引數，根據這些空氣引數自動調整車內空調設定，解決了傳統空調被動響應的滯後問題，讓車內空氣始終保持清新。

百度：

時空聯合動態規劃路線

專利申請方：百度

專利名稱：時空聯合的路線推薦方法、裝置、電子裝置和儲存介質

2025年6月27日公開

當用戶輸入出發地、目的地和出發時間，系統會像在空間地圖和時間軸上展開搜尋，先基於歷史交通資料和即時路況，生成多條主路線方案和備用路線。然後系統會對比主路線和備用路線的空間重疊度，篩出“黃金備用路線”，讓使用者無論遇到什麼路況都能從容應對。

小米：

基於生理與環境引數的音效調校

專利申請方：小米

專利名稱：音效調整方法、電子裝置及計算機可讀儲存介質

2025年6月13日公開

裝置會即時採集如配速、心率等運動引數和心跳頻率等生理引數，或者開車時獲取車速、彎道角度等駕駛狀態與路面噪音等環境引數。根據這些資料自動調校音效，例如跑步時心率飆升，音樂會自動增強低音鼓點，讓每一段旋律都精準貼合用戶的狀態。

dignews.cc

數字人聊天更自然，影像調焦能預防近視|6月網際網路專利盤點

遊戲相關

AI相關

公益民生

相關文章

AI剪影片自帶角色音，手殘黨也能當剪輯大師 |4月網際網路專利盤點

AI彈幕、AI劇情摘要、AI音色克隆……萬物皆可AI|3月專利盤點

MetaQuest3銷量預測下調10％；《精靈寶可夢Go》將在2024年融合AI技術

號稱“拯救ADHD的年度軟體”，我幫病友們試了試……

極度缺人！海外華人注意了！TIKTOK搬運影片，800元/天，時間自由很簡單日結！

急招文學朗誦愛好者，100-400/小時，閱讀的同時也能賺錢！

“聽抖音”功能上線，創作者如何抓住第一波紅利

最強全模態模型Ola-7B橫掃影像、影片、音訊主流榜單，騰訊混元Research&清華&NTU聯手打造

阿里通義開源首個CoT音訊模型，音·畫同步被狠狠拿捏了

最新訊息！美國華人圈突然官宣：2023年最暴利的行業來了，將造就大批億萬富翁