Dynamic Scene Representation with Factorization and Gaussian Splatting

✨ 요약

4D 시공간 데이터를 효율적으로 표현하고 렌더링하기 위해 저차원 인수분해(HexPlane)와 가우시안 스플래팅(Gaussian Splatting)을 활용하며, 동적 장면 모델링을 위해 변형 필드(Deformation Field) 패러다임을 적용함.

📍 학습 내용

1. 4D 볼륨 인수분해 (HexPlane)

1.1 HexPlane 아키텍처

  • 4D 시공간 그리드를 6개의 2D 특징 평면(XY, XZ, XT, YZ, YT, ZT)으로 분해함.

  • 4D 점의 특징은 각 평면에 투영 후 2D 보간 및 융합으로 계산됨.

  • 메모리 복잡도를 O(N^2) 로 줄이고 2D 보간으로 효율적인 특징 추출을 가능하게 함.

2. 3D/4D 가우시안 스플래팅 (Gaussian Splatting, GS)

2.1 GS 패러다임

  • 장면을 점 기반 프리미티브인 3D/4D 가우시안 집합으로 표현함.

  • 느린 볼륨 레이 마칭 대신 병렬화 가능한 미분 가능한 래스터화 파이프라인(“스플래팅”)을 사용하여 이미지를 렌더링함.

  • 4D 공분산 행렬 파라미터화는 메모리 오버헤드가 높아 정규 공간과 변형 필드 분리 방식이 선호됨.

3. 시공간 동역학 모델링 (변형 필드)

3.1 변형 필드 개념

  • 시간에 따라 변하지 않는 정규(canonical) 표현을 정의하고, 각 시간 프레임에 대해 이 정규 표현을 변형시키는 방식을 학습함.

  • Deformable 3D Gaussians나 4D-GS는 단일 3D 가우시안 집합을 정규 표현으로 유지함.

  • 변형 필드는 정규 공간의 좌표와 시간 코드를 입력받아 변위(displacement)를 출력하는 MLP 기반 아키텍처로 구현됨.