글로벌 빅테크 구글이 확산 신경망(Diffusion Neural Network)을 활용해 단일 이미지로부터 고품질 3차원(D) 모델을 생성하는 특허를 최근 공개했다. 이번 기술은 단일 2D 이미지를 입력받아 반복적 샘플링 과정을 거쳐 실제와 유사한 3D 객체를 자동 재구성하는 AI 시스템이다. 기존 3D 모델 생성 과정에서 빈번했던 포즈(pose) 왜곡과 저해상도 한계를 개선한 것이 특징이다.
이 시스템은 먼저 입력 이미지를 기반으로 초기 관측 세트(3D 공간의 표면 정보)를 만들고, 확산 모델을 통해 다수의 샘플링 반복 과정에서 점진적으로 노이즈를 제거하며 객체의 세밀한 특징을 반영해 최종 관측 세트를 완성한다. 이를 통해 단일 이미지에서도 다양한 포즈와 디테일을 반영한 정교한 3D 모델 생성이 가능하다.
특히 기존 포토그래메트리나 멀티뷰 재구성 방식처럼 다각도 이미지 데이터를 요구하지 않고, 단일 RGB 이미지로 사실적인 3D 객체를 구현할 수 있다는 점에서 주목된다. 전자상거래의 가상 피팅룸, 메타버스 아바타, 디지털 콘텐츠 제작, 산업 디자인 및 엔지니어링, 문화재 복원 등 다양한 분야에 적용 가능성이 크다.
업계는 이번 특허가 3D 콘텐츠 제작 비용과 시간을 크게 절감하면서도 사실적 재현성을 제공해, 확산 모델 기반 3D 생성 연구의 산업 적용을 앞당기는 계기가 될 것으로 보고 있다.




이경민 기자 kmlee@etnews.com