[ICT시사용어]소라(Sora)

오픈AI가 공개한 텍스트 입력으로 만든 영상
오픈AI가 공개한 텍스트 입력으로 만든 영상

오픈AI의 생성형 인공지능(AI) '소라'(Sora)는 프롬프트를 입력하면 동영상을 만들어 주는 AI 서비스다.

오픈AI는 지난달 자사 홈페이지를 통해 '텍스트 투 비디오(Text to Video)' 모델인 소라를 공개했다. 텍스트를 입력하면 최대 1분 길이의 동영상을 제작해준다. 소라는 이미지를 동영상으로 생성할 수도 있다. 기존 동영상을 확장하거나 누락된 프레임을 채울 수도 있다.

여러 캐릭터와 특정 유형의 동작, 복잡한 장면 등 최대 1분 길이의 동영상을 빠르게 제작할 수 있다. 언어에 대한 깊은 이해를 갖고 있어 프롬프트를 정확하게 해석하고 생생한 감정을 표현하는 매력적인 캐릭터를 생성할 수 있다.

미라 무라티 오픈AI 최고기술책임자(CTO)는 “소라가 생성하는 동영상을 더욱 사실적으로 만들기 위해 음향을 통합할 계획”이라며 “소라가 생성한 동영상 콘텐츠를 이용자가 편집할 수 있도록 하는 방안도 고민하고 있다”고 전했다.

무라티 CTO는 소라 훈련과 관련, 어떤 데이터를 사용했는지에 대해서는 “공개적으로 이용할 수 있거나 허가된 데이터”라고 말했다. 오픈AI가 파트너십을 맺고 있는 이미지·영상 콘텐츠 업체인 셔터스톡(Shutterstock) 콘텐츠를 사용한다고만 확인했다.

오픈AI는 소라를 처음 공개한 이후 '제한된 수의 창작자'만 사용할 수 있도록 허용하고 있다. 올 하반기 일반인들도 이용할 수 있을 전망이다.

권혜미 기자 hyeming@etnews.com