[손병채의 센스메이킹] 〈35〉AI 시대의 몸:어떻게 바라볼 것인가?

손병채 ROC(Reason of creativity) 대표
손병채 ROC(Reason of creativity) 대표

지난 주말 오픈AI(Open AI)의 새로운 서비스 소라(Sora)가 공개됐다. 소라는 텍스트를 입력해 인공지능(AI) 영상을 제작할 수 있어 공개 직후부터 리뷰어의 찬사를 받고 있다. 간단한 텍스트 몇 줄로 제작돼 공개된 데모 영상들은 햄버거를 먹는 중년 남성의 슬로 모션 영상, 두 사람이 걸어가는 일본 거리를 담아낸 부감샷 등 CF나 영화에서 기획, 연출해 촬영한 장면에 맞먹는 높은 수준의 현실감을 보여준다. 오픈AI는 같은 날 공개한 기술보고서를 통해 소라를 월드 시뮬레이터라 표현했다. 텍스트를 통한 추상화와 매개변수 공간과의 연결로 이 정도로 현실적인 추상화가 가능하다면 앞으로의 GPT 모델의 추론 능력에 엄청난 영향을 미칠 것이며 그 의미는 인간 사회에 등장한 AI의 영향력 측면에서 가히 어마어마하다 할 수 있을 것이다. 하지만 소라에는 여전히 많은 한계도 존재한다. 사람이 쿠키를 한 입 베어 물었지만 이후 쿠키에 베어 문 자국이 사라지거나 러닝머신 위에서 달리고 있는 인간이 조작판이 있는 앞이 아닌 뒤를 향한 채 어색한 팔다리 움직임을 보이며 달리고 있는 장면 등 사용자가 제시한 프롬프트 내 공간적 세부 사항, 시간에 따라 발생하는 변화 등을 정확하게 이해하고 보여주는 데 부족한 부분이 확인된다. 이 같은 원인과 결과의 연결된 사례, 복잡한 장면 속 물리학 구현에 어려움을 겪는다는 건 여전히 AI가 세계를 제대로 이해하지 못하고 있다는 증거이기도 하다. 그러나 오픈AI의 3500만개의 고해상도 사진 및 영상을 보유한 셔터스톡(Shutter Stock)과의 계약을 통해 앞으로 6년 간 AI를 더 학습시킬 계획이라는 23년도의 발표를 고려해 보면 앞으로의 AI 생성 이미지와 영상들이 더욱더 현실에서의 인간이 제작한 수준에 머지않아 한층 가까워질 거라 예상하는 것도 어렵지 않다.

영국의 고고학자 데이비드 웬그로우는 2013년 발표한 저서 '괴물의 기원'에서 원시 이집트에서 메소포타미아 문명, 지중해 철기 시대에 이르기까지 도시가 형성되고 문명이 활발하게 꽃 피워 정치 및 상업 네트워크가 확장된 시기에는 환상적이고 복합적인 비현실적 생물의 시각적 이미지가 만들어져 퍼지지 않은 지역이 없었다고 주장한다. 사자의 몸통에 독수리의 머리와 날개가 더해진 그리핀, 인간의 신체와 소의 머리가 합쳐진 미노타우르스 등의 합성 괴물의 그래픽 묘사가 해당 시대를 살았던 사람들에 의해 각종 벽화나 문헌에 기록되고, 당시 엘리트 지위의 정당화를 위해 확대된 무역 경로를 따라 전달되었다고 한다. 이 다양한 종의 사지나 다른 특징을 분리하고 이를 재조합하여 눈에 보이지 않는 확장된 세계에 대응하는 존재의 이미지를 만드는 현상은 생산 활동에 있어 친족 관계 중심의 자신들이 '전체'라 여겼던 관점이 확장된 사회 변화에 따른 한 번도 만난 적 없는 사람들과의 분업 증가로 스스로 실감한 '부분'으로서의 자각과 그로 인한 두려움과 연결되어 발생했다 해석할 수 있다. 다시 말해 합성물의 창작과 기술 발전으로 확인된 자기 인식과의 관계의 발견이 그가 공유하고자 하는 메시지 중의 하나라는 점이다. 우리는 이미 작년부터 미드저니(Midjourney), DALL-E 등의 AI 이미지 생성 프로그램을 통해 로마 시대의 스파이더맨 동상, 말을 타고 달 표면을 이동하는 우주비행사, 세 개의 팔로 그림을 그리고 있는 로봇 등의 인간 신체의 한계를 벗어난 흥미로우나 기괴한 이미지들을 무수히 확인하고 있다. 그리고 이번에 발표된 소라를 통해 더욱더 많은 AI 생성 영상의 확산이 빨라질 것이다. 중요한 건 초창기 인류 역사의 기록과 함께 반복되고 있는 괴물, 즉 합성물의 묘사와 사회적 전달이 지금 생성 AI의 시대에서 재현되고 있는 점이다. 이러한 흐름은 단순히 트렌드라는 표현에 담기 버거운 이 시대의 세계를 감싸고 있는 '바이브'라 표현할 수 있다. 이 표현이 새롭지는 않으나 우리가 지금 AI 시대로 다가가는 주목할만한 변곡점에 와 있다고 보이기에 이 흐름을 좀 더 진지하게 받아들여야 할 필요가 있다.

긴 형식의 논증과 설명이 존재할 수 없는 X, 가장 많이 소비되고 중독성 강한 유튜브(YouTube), 틱톡(TikTok) 내 쇼츠 영상은 탈맥락화된 이미지의 사회적 소비 현상을 증명한다. 점점 더 순간적이고 연상적인 시적 이미지가 중요해졌고 이는 곧 무엇이 정보로 간주되는지 알려주는 기존의 해석 관련 관점이 뒤집혔음을 의미한다. 요컨대, 무엇을 볼 것인가가 아니라 어떻게 볼 것인가에 대한 변화가 필요하다. 신체와 연관된 트렌드나 현상에 대해 좀 더 의미론적으로, 분석적으로 다른 초기 접근을 선택해야 한다. 게스, 켈빈 클라인 마케팅 캠페인 속 모델 군단의 미학 대신 다양한 신체 그대로를 당당하게 표현하는 란제리 브랜드의 철학이 인정받고, 남자인지 여자인지 모를 입술 위 분홍색 립스틱의 이미지가 십 대에게 다가가는 효과적 전략의 표상이 된 시대다. 기술의 미래를 상상하고 기술의 발전을 논할 때 반드시 함께 존재하는 건 인간의 신체다. 인간 신체를 어떻게 볼 것인가라는 질문은 앞으로 더 복잡해지고 중요해질 것이다.

손병채 ROC(Reason of creativity) 대표 ryan@reasonofcreativity.com