3 张照片 → 全景 3D:苹果携手推出革命性 AI 模型 Matrix3D,简化 3D 重建过程
作者:五福软件园时间:2025-05-18 14:12:15
本站 5 月 14 日消息,科技媒体 9to5Mac 昨日(5 月 13 日)发布博文,报道称苹果机器学习团队携手南京大学和香港科技大学,推出名为 Matrix3D 的 3D AI 模型,专注于从少数 2D 照片中重建真实世界的物体和场景。
用户只需提供几张图像,模型就能自动生成高质量的 3D 输出。这不仅简化了操作,还为应用领域打开了新机遇,进一步推动了 AI 领域的协作。
摄影测量技术利用照片进行测量,从而创建 3D 模型或地图。目前的流程依赖姿态估计和深度预测等多个独立模型来处理具体步骤,而这种分段方法容易导致低效和错误。
Matrix3D 则革新了这一体系。它一次性整合图像、相机参数(如角度和焦距)以及深度数据等所有过程,通过统一架构处理这些元素,减少了中间环节,让重建过程更流畅、更可靠。研究者指出,这种整合设计显著降低了人为错误的风险,并提高了整体性能。
在训练策略方面,研究者采用了掩码学习方法,类似于早期 Transformer 基础 AI 系统。这种技术借鉴了 ChatGPT 早期版本的训练理念,在训练过程中随机隐藏部分输入数据,迫使模型学会“填充空白”。这强化了模型的适应性。即使数据集较小或不完整,Matrix3D 也能有效学习关键特征。
测试结果证明了 Matrix3D 的强大表现。用户只需三张输入图像,该模型就能生成详细的 3D 重建,包括物体和整个环境,为沉浸式技术带来了实际应用潜力。本站附上演示视频如下:
例如,在 Apple Vision Pro 等头显设备中,Matrix3D 可以创建逼真的虚拟场景,提升用户体验。研究者表示,这种能力将加速元宇宙和增强现实的发展。
参考
Matrix3D: Large Photogrammetry Model All-in-One
相关文章
-
3 张照片 → 全景 3D:苹果携手推出革命性 AI 模型 Matrix3D,简化 3D 重建过程
本站 5 月 14 日消息,科技媒体 9to5Mac 昨日(5 月 13 日)发布博文,报道称苹果机器学习团队携手南京大学和香港科技大学,推出名为 Matrix3D 的 3D AI 模型,专注于从少数
-
为规避关税,苹果将扩大巴西 iPhone 产量
感谢本站网友 Jenny太美 的线索投递! 北京时间 5 月 10 日,根据巴西商业杂志《Exame》的最新报道,为了规避美国政府的进口关税,苹果公司已决
-
微软体验中心仅剩两家,悉尼店已于本月关闭
本站 5 月 15 日消息,微软曾在全球范围内开设了众多零售门店,销售 Surface 电脑、Windows Phone 智能手机、电脑配件、软件等产品。然而,2020 年疫情爆发后,微软被迫关闭了所
-
日本首款 Windows 游戏掌机 Tenku Luna 公布:120Hz 屏幕,双 USB 4 接口
本站 5 月 15 日消息,Tenku Luna 据称将成为日本厂商推出的首款 Windows 游戏掌机,这款设备配备了 7 英寸 120Hz 刷新率显示屏、双 USB4 接口、50Wh 容量电池以及
-
Behemoth 难产:Meta 旗舰 AI 模型被曝遭遇技术瓶颈
本站 5 月 16 日消息,华尔街日报昨日(5 月 15 日)发布博文,报道称 Meta 公司推迟了其旗舰 AI 模型“Behemoth”的发布计划,引发内部对数十亿美元 AI 投资方向的担忧。消息称
-
iQOO WATCH 5 支持电竞游戏模式,可自动记录游戏心率等状态数据
感谢本站网友 風見暉一 的线索投递! 本站 5 月 16 日消息,iQOO WATCH 5 将于 5 月 20 日 19:00 发布,最新预热显示,这款新