苹果研发新型AI模型实现单张图像3D重建并还原真实光照效果

2026-03-17 10:08

苹果研究人员推出名为LiTo的新型AI模型，可仅凭单张图像重建3D物体，并在不同视角下保持反射、高光等光照效果的一致性。该模型通过将表面光场信息编码为紧凑的潜在向量，在统一的3D潜在空间中联合建模物体几何结构与视角依赖的外观。研究团队利用数以千计在150个视角和3种光照条件下渲染的物体进行训练，使模型能从随机采样的子集学习并重构完整3D模型。该技术突破了传统方法依赖多角度图像的限制，提升了3D重建的真实感与效率，相关成果已发布于项目页面。

苹果研发新型AI模型实现单张图像3D重建并还原真实光照效果

苹果研究人员推出名为LiTo的新型AI模型，可仅凭单张图像重建3D物体，并在不同视角下保持反射、高光等光照效果的一致性。

该模型通过将表面光场信息编码为紧凑的潜在向量，在统一的3D潜在空间中联合建模物体几何结构与视角依赖的外观。研究团队利用数以千计在150个视角和3种光照条件下渲染的物体进行训练，使模型能从随机采样的子集学习并重构完整3D模型。

传统3D重建方法通常需要多角度图像输入，而LiTo突破了这一限制，仅需单张图像即可实现高真实感的3D重建。模型通过编码器将物体信息压缩为潜在空间中的数学描述，再由解码器重建出完整几何结构及不同视角下的光照表现，包括镜面高光和菲涅尔反射等复杂效果。

研究团队在项目页面发布了LiTo与TRELLIS模型的对比结果，用户可进行交互式对比。该技术对计算机视觉、增强现实、数字内容创作等领域具有潜在应用价值，相关研究成果已公开发布。

技术原理简述

LiTo的核心在于利用潜在空间（latent space）对3D物体进行高效表征。通过将RGB深度图像中的表面光场随机采样并编码为潜在向量，模型学习到同时包含几何结构和外观变化的统一表征。训练过程中，解码器从子集数据中学习生成完整3D物体及其在不同光照和视角下的真实外观表现。

编辑点评

编

编辑点评

2026-03-17 10:08

苹果此次推出的LiTo模型在3D重建领域具有显着技术突破，尤其在单视角图像输入条件下实现高真实感光照效果的还原，标志着计算机视觉与生成式AI的深度融合。该技术不仅提升了3D内容生成的效率，也为增强现实、虚拟现实、数字孪生等应用场景提供了更强大的底层支持。从全球科技竞争角度看，苹果在AI底层技术上的持续投入，反映了科技巨头对下一代人机交互与数字内容生态的布局意图。尽管目前仍处于研究阶段，但其在工业设计、游戏开发、远程协作等领域的潜在商业价值不容忽视。未来若能结合实时渲染与边缘计算，可能进一步推动消费级3D内容创作的普及。

苹果研发新型AI模型 实现单张图像3D重建并还原真实光照效果

技术原理简述

编辑点评

相关阅读

苹果在巴西因涉嫌虚假宣传AI功能广告被调查

微软等科技巨头五月补丁日修复大量安全漏洞 人工智能助力漏洞检测

谷歌加速推进Gemini深度整合Android系统 以应对苹果AI战略挑战

苹果收购Color.io开发公司Patchflyer GmbH 加强创作者生态布局

特朗普访华随行高管名单确认：苹果CEO库克在列

苹果研发新型AI模型实现单张图像3D重建并还原真实光照效果

微软等科技巨头五月补丁日修复大量安全漏洞人工智能助力漏洞检测

谷歌加速推进Gemini深度整合Android系统以应对苹果AI战略挑战