Wooseok Song profile photoPaper Reviews

NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis

ECCV 2020arXiv v2: 3 Aug 2020
Authors
Ben Mildenhall; Pratul P. Srinivasan; Matthew Tancik; Jonathan T. Barron; Ravi Ramamoorthi; Ren Ng
Affiliations
UC Berkeley; Google Research; UC San Diego
Topics
#Neural Rendering#Radiance Field#View Synthesis#Volume Rendering

핵심 요약

NeRF는 scene을 voxel이나 mesh가 아니라, 3D 위치와 viewing direction을 입력받아 density와 view-dependent color를 출력하는 연속 5D neural radiance field로 표현한다.

문제sparse posed images로 photorealistic novel view 합성
해결5D radiance field + differentiable volume rendering
근거synthetic/real view synthesis와 ablation
한 문장 요약

NeRF의 핵심은 MLP가 장면 자체를 저장하고, differentiable volume rendering으로 관측 image와 맞추며 학습한다는 점이다.

Contribution 01

5D Radiance Field

위치 x와 방향 d에서 density σ와 RGB radiance c를 예측하는 continuous scene function.

Contribution 02

Differentiable Rendering

ray별 volume rendering integral을 differentiable하게 근사해 image reconstruction loss로 최적화.

Contribution 03

Positional Encoding

저주파에 치우친 MLP가 high-frequency geometry/texture를 표현하도록 좌표를 고주파 feature로 확장.

Contribution 04

Hierarchical Sampling

coarse network가 찾은 중요한 구간에 fine samples를 더 배치해 ray sampling 효율 개선.

내가 얻은 인사이트

NeRF는 “3D를 어떻게 저장할까”보다 “image로부터 3D function을 어떻게 differentiable하게 학습할까”가 핵심이다. volume rendering이 학습 가능한 bridge 역할을 한다.

처리 흐름
01Input Imagesknown camera poses
02Camera Rayssample 3D points
03Positional Encodinghigh-frequency coordinates
04MLP FΘdensity + RGB
05Volume Renderingcomposite colors
06Photometric Lossoptimize per scene
접근 방식 비교
Voxel / MPI

명시적 discretization

고해상도 장면에서 memory와 sampling cost가 커짐.

Surface Implicit

surface 중심

SDF/occupancy는 geometry에는 강하지만 복잡한 view-dependent appearance 표현이 어려웠음.

NeRF

volumetric radiance field

continuous density와 view-dependent radiance를 volume rendering으로 image에 투영.

논문 상세 정리

아래부터는 기존 논문 내용을 최대한 담은 상세 해석이다. 핵심 흐름에서 벗어나는 배경지식, notation, 부가 자료는 접어두었다.

Comments