4090玩转大场景几何重建,RGB渲染和几何精度达SOTA

仅用4090就能实现大规模城市场景重建

高效几何重建新架构CityGS-X来了,通过一种新型并行化混合分层三维表征架构(PH²-3D)的可扩展系统,突破了传统三维重建在算力消耗和几何精度上的限制。

4090玩转大场景几何重建,RGB渲染和几何精度达SOTA

4090玩转大场景几何重建,RGB渲染和几何精度达SOTA

算力瓶颈无处不在,当前3D高斯泼溅技术虽取得显着进展,却仍面临三大核心挑战:处理速度缓慢、计算成本高昂、几何精度有限

来自上海AI Lab和西工大的研究团队认为,这些问题的根源在于其非结构化设计本质与并行化机制的缺失。

这就引出一个关键命题:能否构建一个兼具高效性、扩展性和精确性的新一代几何重建框架?

4090玩转大场景几何重建,RGB渲染和几何精度达SOTA

由此,团队提出了CityGS-X,研究的主要贡献在于:

  • 提出并行化混合层次三维表征(PH²-3D)的可扩展架构,摒弃了传统大场景分块算法造成的训练冗余,相比现有的SOTA几何重建方法,训练速度提升了一倍
  • 提出多任务批渲染框架下的动态分配锚点的并行机制,在训练阶段以及渲染阶段可以利用多张低端卡平替以及超越目前单张高端显卡,对于5000+图的大场景(Matrixcity)只需4卡4090即可实现
  • 提出在模态批渲染框架下的渐进式RGB-深度-法向联合训练方法,在RGB渲染和几何精度上都达到同类任务中的SOTA。

4090玩转大场景几何重建,RGB渲染和几何精度达SOTA

以下是更多细节。

CityGS-X的构建

CityGS-X提出基于并行化混合层次三维表征(PH²-3D)的可扩展架构,摒弃传统繁琐的合并-分区流程,首创批处理级多任务渲染机制;

开发动态多细节层次体素分配策略,实现显存占用与计算效率的平衡;

设计渐进式RGB-深度-法线联合训练方案,通过多视角约束与深度先验的协同优化,显着提升几何一致性。

4090玩转大场景几何重建,RGB渲染和几何精度达SOTA

PH²-3D的设计

4090玩转大场景几何重建,RGB渲染和几何精度达SOTA

批处理级多任务渲染机制

团队采用批处理级多任务渲染机制,首先将批量渲染图像分割为16×16像素的图块,并基于Grendal-GS的自适应负载均衡策略分配到不同GPU。

在每块渲染任务中,提出视角相关高斯迁移策略:并行搜索所有GPU上各LoD层级的相交体素,预测对应高斯属性(如公式所示),并迁移至任务分配GPU。

随后各区块遵循经典基于瓦片的光栅化并行渲染:

4090玩转大场景几何重建,RGB渲染和几何精度达SOTA

其中N为迁移高斯点数量,π(·)为迁移高斯重排序函数。

同时基于PGSR策略生成当前视角法线图:

4090玩转大场景几何重建,RGB渲染和几何精度达SOTA

4090玩转大场景几何重建,RGB渲染和几何精度达SOTA

批处理级连续性渐进训练

作者提出三阶段渐进式训练策略:

阶段一:批处理级RGB训练

4090玩转大场景几何重建,RGB渲染和几何精度达SOTA

阶段二:增强深度先验训练

基于最新单目深度估计器具有平滑连续的表面预测特性,作者提出改进方案:

4090玩转大场景几何重建,RGB渲染和几何精度达SOTA

阶段三:批处理级几何训练

4090玩转大场景几何重建,RGB渲染和几何精度达SOTA

实验结果

以下是与主流方法的渲染指标对比(本文方法均使用4卡4090)

4090玩转大场景几何重建,RGB渲染和几何精度达SOTA

深度图可视化结果:

4090玩转大场景几何重建,RGB渲染和几何精度达SOTA

对比试验中,团队在RGB渲染、深度渲染与其它方法对比,实验表明CityGS-X在RGB渲染最优的情况下,深度图也最准确,具有更少的浮点以及地面的空洞

同时对于法线图渲染,CityGS-X也展现出更准确的细节

法线图可视化:

4090玩转大场景几何重建,RGB渲染和几何精度达SOTA

与目前的SOTA方法相比,CityGS-X在整体的mesh可视化上都有显着提升

texture和mesh可视化对比:

4090玩转大场景几何重建,RGB渲染和几何精度达SOTA

时间对比实验结果:

4090玩转大场景几何重建,RGB渲染和几何精度达SOTA

F1分数对比实验结果:

4090玩转大场景几何重建,RGB渲染和几何精度达SOTA

在MatriCity数据集上进行定量对比,CityGS-X在重建精度上有显着提升,同时在训练速度上也有明显提升。

论文链接:https://arxiv.org/pdf/2503.23044
项目主页:https://lifuguan.github.io/CityGS-X/
项目代码:https://github.com/gyy456/CityGS-X

主题测试文章,只做测试使用。发布者:人脑网,转转请注明出处:https://www.rennao.com.cn/5473.html

(0)
人脑网的头像人脑网
上一篇 2025年4月14日 下午3:18
下一篇 2025年4月14日 下午3:18

相关推荐

  • 英伟达含量为零!华为密集模型比肩DeepSeek-R1,纯昇腾集群训练

    密集模型的推理能力也能和DeepSeek-R1掰手腕了? 华为利用纯昇腾集群训练出的盘古Ultra,在数学竞赛、编程等推理任务当中,和R1打得有来有回。 关键是模型参数量只有135B,整个训练过程零英伟达含量,而且没有出现损失尖峰。 通过改进的模型架构和系统优化策略,盘古Ultra拥有优异的性能表现和52%以上的算力利用率。 并且有网友表示,训练过程中没有出…

    2025年4月16日
    1800
  • 中国初创芯片登Nature:比英伟达A10快500倍!自研光电混合技术

    来自国内的光电混合芯片技术,登上最新顶刊Nature! 这次的成果主要聚焦在了自主研发的光子计算处理器——PACE(Photonic Arithmetic Computing Engine)。 简单来说,PACE是一种基于光电混合的架构,它通过光执行矩阵向量乘法,可以实现超低延迟和高能效的计算。 根据论文中公开的数据显示,PACE在解决组合优化问题(如伊辛问…

    2025年4月14日
    1100
  • 装满智能体AI的手机,正在呼唤一个“Type-C时刻”

    当手机中装满智能体,下一代AI手机的雏形正在显现。 天玑开发者大会上,手机芯片巨头联发科提出了全新的AGENTIC AI UX雏形。 在联发科的畅想中,AI助手不再是一个单纯的执行者,而是变成了一个能够协作,甚至“懂得拒绝”的伙伴。 一同发布的,还有全新升级的旗舰5G智能体AI芯片天玑9400+,AI能力再次升级。 相比前半代的“端侧AI最强芯”天玑9400…

    2025年4月16日
    2000
  • 在交互设计过程中,你需要持续关注的五个问题

    认真对待交互设计过程中的每一个设计环节、每一个问题,是提高交互稿质量的基石。过程中的问题很多,需要我们持续关注并解决。

    2017年4月18日
    1102
  • 重构训练框架,开源新方法:抛弃替代损失函数,仅需优化原始目标

    抛弃替代损失函数,仅需优化原始目标, 强化学习新范式来了: 消除critic和reference模型,避免KL散度约束;解决优势函数和梯度估计两个偏差。 来自阿里-高德地图的团队提出了一种相当简单的强化学习训练新方法:组策略梯度优化GPG(Group Policy Gradient)。 GPG开创性地从底层重构强化学习训练框架,仅需优化原始目标,解决已有方法…

    2025年4月27日
    500

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信