CVPR2025高分論文!從照片重建3D向量,告別模糊渲染,重建邊緣更清晰

©作者 |吳旻燁、戴海釗等
單位 |魯汶大學、上海科技大學
來源 | 機器之心
三維高斯潑濺(3D Gaussian Splatting, 3DGS)技術基於高斯分佈的機率模型疊加來表徵場景,但其重建結果在幾何和紋理邊界處往往存在模糊問題。這種模糊效應會隨著重建過程中不確定性的累積而愈發顯著。如圖 1 所示,透過提高渲染解析度可以明顯觀察到這種邊界模糊現象。
▲ 圖1. BG-Triangle 的樣例結果展示和對比
針對這一技術瓶頸,由比利時魯汶大學吳旻燁與上海科技大學戴海釗等研究人員組成的團隊在 CVPR 2025 上提出了創新性的解決方案——Bézier Gaussian Triangle(BG-Triangle)三維表徵方法
該方法巧妙融合了 Bézier 三角形的向量圖形特性與高斯機率模型,不僅實現了 3D 場景的精確重建,還支援解析度無關的可微渲染。透過引入不連續感知渲染技術,BG-Triangle 有效降低了物體邊界的不確定性,從而獲得更加銳利的渲染效果。與現有演算法相比,該方法還具有引數量更少的顯著優勢。

論文標題:
BG-Triangle: Bézier Gaussian Triangle for 3D Vectorization and Rendering
論文作者:
吳旻燁、戴海釗、姚凱欣、Tinne Tuytelaars、虞晶怡
論文連結:
https://arxiv.org/abs/2503.13961
專案主頁和程式碼:
https://wuminye.github.io/projects/BGTriangle/
背景介紹
在計算機圖形學和 3D 計算機視覺的發展過程中,場景表示經歷了從傳統的離散幾何表示到連續表示的演變。
早期,網格(meshes)、點雲(point clouds)和體素(voxels)等傳統方法被廣泛應用於 3D 重建和渲染。這些方法能顯式地精確建模場景,但難以實現基於圖片的端到端的重建最佳化。
輻射場(Radiance Fields)這種 3D 表徵的興起,使得可微渲染(differentiable rendering)更加靈活,最佳化演算法能夠直接基於渲染影像的誤差來更新 3D 表示。
Neural Radiance Fields (NeRF) 透過神經網路隱式編碼輻射場和密度場,實現了高質量的新視角合成,但由於其連續體積表示的特性,難以精確捕捉物體的邊界和幾何細節。
隨後,3D Gaussian Splatting (3DGS) 透過顯式的高斯點雲表示,提高了渲染效率和準確性,並利用連續的高斯分佈實現了靈活的表徵最佳化,適用於複雜場景的建模。
然而,這些方法在處理物體的銳利邊緣時仍然存在侷限性,尤其是在近距離觀察時,由於漸變分佈的疊加容易出現模糊或過渡不清的現象。
因此,本研究提出了一種介於離散和連續之間的三維混合表示方法,在可微渲染的框架下結合向量圖形和機率建模,利用矢量表達的靈活高效性以更少的圖元數量實現更精確的幾何和邊界建模,為 3D 場景表示提供了一種新的解決方案。
基本原理
1. 基本元素:BG-Triangle 圖元
BG-Triangle 是一種融合了貝塞爾三角形與 3D 高斯模型的場景表徵方法。該方法將每個貝塞爾三角形視為一個圖元,透過一組控制點引數化定義場景的局部曲面區域。作為顯式幾何表示,貝塞爾三角形能夠清晰確定渲染視角下的圖元輪廓範圍。此外,透過靈活調整控制點位置,可以生成不同彎曲程度的曲面和邊界。
▲ 圖2. 貝塞爾三角圖元透過控制點來改變幾何形狀
BG-Triangle 圖元還編碼了高斯的引數屬性,包括形狀、大小和顏色等資訊。利用這些屬性,可以在圖元內自由生成用於渲染的高斯分佈。這些高斯的位置與控制點相繫結,從而使圖元具備可微特性。
▲ 圖3. 貝塞爾三角形圖元中編碼的引數屬性可以構造生成出任意一點的高斯分佈的形狀和顏色
2. 不連續感知渲染
高斯雖然提供了可微的性質,但是其連續的分佈無法表達不連續的紋理和幾何邊界。為此,研究者們使用貝塞爾三角形的渲染輪廓來對高斯的分佈進行約束。具體來說,渲染演算法會重新計算輪廓邊界(圖中的白色實線)周圍區域(圖中虛線之間的區域)的高斯權重,從而降低高斯分佈對圖元外部區域的影響效果。
▲ 圖4. BG-Triangle使用圖元的邊界對高斯重新計算權重
透過調整邊界寬度(即兩條虛線之間的距離),可以精確控制渲染效果的銳利程度,實現不連續的邊界渲染效果。
▲ 圖5. 調整邊界的寬度可以控制邊界的銳利程度。當使用極小邊界寬度時,就型成了不連續的高斯權重
3. 渲染管線與重建最佳化
▲ 圖6. BG-Triangle的渲染管線
BG-Triangle 的渲染管線分為兩個部分。第一部分將圖元渲染為目標視角下的圖形緩衝區,該緩衝區包含非連續感知渲染所需的資訊。這一部分可透過現有的圖形光柵化管線實現。
第二部分利用緩衝區資訊生成畫素對齊的高斯分佈,並根據邊界進行渲染。在此過程中,梯度透過第二部分的高斯生成模組直接傳遞到貝塞爾三角形圖元上。具體的梯度公式推導詳見原文附件,供感興趣的讀者參考。
在實現過程中,研究者首先使用粗糙的點雲初始化圖元位置,隨後透過動態分裂和刪除演算法在最佳化過程中調整圖元數量,以適應不同複雜度的場景。這種設計使得資訊量較少的區域僅需少量圖元即可表達,從而顯著提升了資訊利用效率。
▲ 圖7. 組成場景的圖元邊界示意圖。不同區域使用不同大小的圖元進行自適應的表示。
實驗結果
實驗結果表明,BG-Triangle 在邊界清晰度 和 引數效率 方面表現優越。相比 3D Gaussian Splatting(3DGS)、Mip-Splatting、Mini-Splatting 和 Scaffold-GS,能以極少的圖元數量實現更高質量的渲染。
在相似引數規模下,BG-Triangle 在 LPIPS 評分(感知質量)上顯著優於其他方法,且在放大渲染中仍可保持清晰的物體邊界,而 3DGS 及相關方法在近距離觀察時會產生模糊或偽影。
同時,透過對貝塞爾三角形向量線段的提取,可以組成三維的線條,用於描述場景的幾何特徵,如圖所示:
研究者們在 CUDA 中高效地實現了本文的演算法,達成了即時渲染的效果。並且在 NVIDIA 3090GPU 單卡上可以半小時左右完成場景的重建。
結論
這篇研究創新性地提出了一種基於貝塞爾三角形向量曲面的三維場景表徵方法,並提供了一種有效的端到端的可微渲染和訓練框架。
在渲染質量上,BG-Triangle 能夠保留銳利的邊界,比 3DGS 具有更好的幾何精度。同時,BG-Triangle 使用更少的圖元,在引數效率和渲染清晰度之間達到了更好的平衡。
BG-Triangle 在較小的引數量下有渲染質量優勢,尤其是在感知質量(LPIPS 評價)上優勢顯著。
更多閱讀
#投 稿 通 道#
 讓你的文字被更多人看到 
如何才能讓更多的優質內容以更短路徑到達讀者群體,縮短讀者尋找優質內容的成本呢?答案就是:你不認識的人。
總有一些你不認識的人,知道你想知道的東西。PaperWeekly 或許可以成為一座橋樑,促使不同背景、不同方向的學者和學術靈感相互碰撞,迸發出更多的可能性。 
PaperWeekly 鼓勵高校實驗室或個人,在我們的平臺上分享各類優質內容,可以是最新論文解讀,也可以是學術熱點剖析科研心得競賽經驗講解等。我們的目的只有一個,讓知識真正流動起來。
📝 稿件基本要求:
• 文章確係個人原創作品,未曾在公開渠道發表,如為其他平臺已發表或待發表的文章,請明確標註 
• 稿件建議以 markdown 格式撰寫,文中配圖以附件形式傳送,要求圖片清晰,無版權問題
• PaperWeekly 尊重原作者署名權,並將為每篇被採納的原創首發稿件,提供業內具有競爭力稿酬,具體依據文章閱讀量和文章質量階梯制結算
📬 投稿通道:
• 投稿郵箱:[email protected] 
• 來稿請備註即時聯絡方式(微信),以便我們在稿件選用的第一時間聯絡作者
• 您也可以直接新增小編微信(pwbot02)快速投稿,備註:姓名-投稿
△長按新增PaperWeekly小編
🔍
現在,在「知乎」也能找到我們了
進入知乎首頁搜尋「PaperWeekly」
點選「關注」訂閱我們的專欄吧
·


相關文章