Wooseok Song profile photo Paper Reviews

MapAnything: Universal Feed-Forward Metric 3D Reconstruction

3DV 2026Published: 3DV 2026 / arXiv v3: 23 Jan 2026
Authors
Nikhil Keetha; Norman Muller; Johannes Schonberger; Lorenzo Porzi; Yuchen Zhang; Tobias Fischer; Arno Knapitsch; Duncan Zauss; Ethan Weber; Nelson Antunes; Jonathon Luiten; Manuel Lopez-Antequera; Samuel Rota Bulo; Christian Richardt; Deva Ramanan; Sebastian Scherer; Peter Kontschieder
Affiliations
Meta Reality Labs; Carnegie Mellon University
Topics
#3D Reconstruction#Metric 3D#Feed-forward#Foundation Model

핵심 요약

MapAnything은 image와 optional geometric input을 함께 받아 metric 3D geometry와 camera를 한 번에 예측하는 universal feed-forward 3D reconstruction model이다.

문제task별 3D pipeline 해결factored representation 근거12개 이상 task setting
한 문장 요약

논문의 핵심은 multi-view geometry를 ray, ray depth, pose, global metric scale로 분해해, 어떤 geometric 정보가 주어져도 같은 모델 안에서 활용하게 만드는 것이다.

Contribution 01

Flexible Inputs

image에 ray, pose, depth, partial reconstruction을 선택적으로 결합.

Contribution 02

Factored Outputs

하나의 coupled pointmap 대신 local ray, ray depth, pose, metric scale을 분리 예측.

Contribution 03

Universal Training

label이 있는 factor에만 loss를 적용해 partial supervision dataset을 함께 학습.

Contribution 04

Broad Evaluation

SfM, MVS, calibration, metric depth, depth completion 계열을 함께 평가.

내가 얻은 인사이트

MapAnything이 중요한 이유는 단순히 multi-view network를 키운 것이 아니라, 입력으로 무엇이 주어질 수 있는가를 representation 설계 안에 넣었다는 점이다.

처리 흐름
01Imagesone or more views
02Optional Geometryrays / pose / depth
03Encodersshared latent space
04Transformermulti-view attention
05HeadsDPT / pose / scale
06Metric 3Dscene + cameras
접근 방식 비교
Classical 3D Pipeline

task-specific module

SfM, calibration, BA, MVS, depth가 여러 단계의 별도 문제로 나뉨.

DUSt3R / VGGT Style

image-first feed-forward 3D

강한 feed-forward prior를 쓰지만 geometric input과 metric scale을 항상 자연스럽게 다루지는 않음.

MapAnything

geometry-aware unified model

factored scene representation으로 image, ray, pose, depth를 유연하게 섞음.

논문 상세 정리

아래부터는 기존 논문 내용을 최대한 담은 상세 해석이다. 핵심 흐름에서 벗어나는 배경지식, notation, 부가 자료는 접어두었다.

Comments