Wooseok Song profile photoPaper Reviews

TTT3R: 3D Reconstruction as Test-Time Training

ICLR 2026Conference Paper
Authors
Xingyu Chen; Yue Chen; Yuliang Xiu; Andreas Geiger; Anpei Chen
Affiliations
Zhejiang University; Westlake University; University of Tuebingen / Tuebingen AI Center
Topics
#3D Reconstruction#Test-Time Training#Recurrent State#CUT3R

핵심 요약

TTT3R은 recurrent 3D reconstruction의 state update를 test-time online learning으로 재해석하고, alignment confidence를 token별 learning rate로 사용한다.

문제long-context forgetting해결confidence-guided learning rate근거pose / depth / reconstruction
한 문장 요약

TTT3R은 CUT3R식 constant-memory streaming을 유지하되, 모든 state를 똑같이 덮어쓰는 대신 confidence-guided per-token update weight \(\beta_t\)로 memory retention과 adaptation을 조절한다.

Contribution 01

TTT View

recurrent state를 test-time에 갱신되는 fast weight로 해석.

Contribution 02

Learning Rate

memory-observation alignment confidence에서 token별 learning rate 계산.

Contribution 03

Training-free

model fine-tuning 없이 inference-time update rule로 plug-in 적용.

Contribution 04

Long Context

constant memory를 유지하면서 long-horizon pose/depth/reconstruction 안정성 개선.

처리 흐름
01Image Streamincoming frames
02Recurrent StateCUT3R memory
03Alignmentstate-query / obs-key
04Learning Ratetoken-wise beta
05State Updateconfidence-gated write
06Outputspose / pointmap / depth
접근 방식 비교
Full Attention

VGGT / Fast3R

history 보존 강함, memory 증가.

Recurrent

CUT3R

constant memory, long-context forgetting.

Explicit Memory

Point3R

forgetting 완화, memory 비용 증가.

TTT3R

Confidence Gate

confidence-gated write로 효율 유지.

논문 상세 정리

아래부터는 기존 논문 내용을 최대한 담은 상세 해석이다. 핵심 흐름에서 벗어나는 배경지식, notation, 부가 자료는 접어두었다.

Comments