Wooseok Song profile photo Paper Reviews

DROID-SLAM: Deep Visual SLAM for Monocular, Stereo, and RGB-D Cameras

NeurIPS 2021arXiv v2: 2 Feb 2022
Authors
Zachary Teed; Jia Deng
Affiliations
Princeton University
Topics
#Visual SLAM#DROID-SLAM#Differentiable BA#Deep Learning

핵심 요약

DROID-SLAM은 update operator가 예측한 flow revision을 Dense Bundle Adjustment(DBA) layer로 넘겨, camera pose와 pixelwise inverse depth를 반복적으로 함께 업데이트하는 deep visual SLAM 시스템이다.

문제실세계 조건에서 SLAM failure 발생
해결learned correspondence + DBA loop
근거4개 benchmark, 3개 sensor로 검증
한 문장 요약

신경망이 SLAM을 대체한다기보다, learned correspondence update와 기하학적 Bundle Adjustment를 하나의 recurrent loop로 묶어 pose-depth 추정을 반복 개선하는 구조.

Contribution 01

Frame-Graph Update

임의 개수의 frame graph에서 camera pose와 inverse depth를 동시에 반복 업데이트.

Contribution 02

Dense Bundle Adjustment

flow revision과 confidence를 reprojection objective로 바꿔 Gauss-Newton pose-depth update 수행.

Contribution 03

Full SLAM System

frontend local BA와 backend global BA/loop closure를 비동기 thread로 구성.

Contribution 04

Cross-Sensor Generalization

monocular synthetic video로 학습한 단일 모델을 stereo/RGB-D 입력에도 재학습 없이 활용.

내가 얻은 인사이트

DROID-SLAM의 핵심은 딥러닝이 기하학을 없앤 것이 아니라, 기하학적 최적화가 recurrent network의 내부 연산이 되었다는 점이다. 그래서 같은 모델이 monocular로 학습되어도 stereo/RGB-D의 추가 제약을 테스트 시점의 optimization objective 안으로 자연스럽게 받을 수 있다.

처리 흐름

update operator가 correspondence revision을 만들고, DBA가 이를 pose-depth 갱신으로 바꾸는 순서.

01Video Inputmonocular / stereo / RGB-D
02Feature & Context1/8 scale dense feature
03Frame Graphcovisible frame edges
04Update Operatorflow revision + confidence
05DBA Layerpose-depth optimization
06Trajectory / Reconstructionlocal BA + global BA
입력별 확장

학습은 monocular에서 출발하지만, test-time objective에 stereo/RGB-D 관측 제약을 추가할 수 있다.

Monocular

학습의 기본 입력

scale ambiguity가 있지만, recurrent update와 DBA를 통해 pose-depth를 공동 추정.

Stereo

추가 기하 제약

재학습 없이 stereo correspondence를 활용해 depth/scale 제약을 강화.

RGB-D

깊이 관측 활용

depth sensor 입력을 테스트 시점의 관측 제약으로 받아 robustness와 accuracy를 개선.

논문 상세 정리

아래부터는 기존 논문 내용을 최대한 담은 상세 해석이다. 핵심 흐름에서 벗어나는 배경지식, notation, 부가 자료는 접어두었다.

Comments