'어벤져스:인피니티 워'(이하 어벤져스) 오역 논란이 최근 큰 파문을 일으켰다. 담당 번역가는 자질을 의심받았다. 차라리 '기계 번역으로 대체하는 것이 나았을 것'이라는 세간의 비아냥거림을 듣는 처지가 됐다.
'어벤져스'에서 비롯된 오역 논란은 '번역가 대 번역기' 구도를 낳았다. 특정 번역가의 자질과 역량에 대한 공분을 불러일으킴과 동시에 인공지능(AI) 번역 시대를 맞이한 번역가 입장을 재조명한다. AI 번역기가 등장한 현 시대에 사람 번역가 역할은 무엇일까. AI 번역기가 이보다 더 고도화된다면 번역가라는 직업은 아예 사라지는 것이 아닐까.
사실 '어벤져스' 번역 작업을 실제로 AI 번역기에 맡겼다면 떼어 놓은 문장을 번역한 표현은 큰 문제가 없다. 그러나 전체 맥락, 문화 배경, 트렌드를 아우르는 자연스러운 의미 전달이 이뤄지지 않았을 것이다. 사람들은 대부분 아무리 발달된 AI도 '상황 맥락'을 판단해서 '작가 역량'을 발휘한 번역은 사람에 못 미친다는 것에 공감한다. 이번 사례도 마찬가지다. 번역가에게 기대하는 바를 크게 저버렸기 때문에 공분을 샀다.
실제로 좋은 번역가가 작품을 번역할 때 고려해야 할 것은 매우 넓고 깊다. 때로는 작가처럼 맥락의 빈 부분을 채워 넣어 작품의 이해를 돕는 것도 번역가 실력과 센스에 포함된다. 한편 이러한 넓고 깊은 번역은 AI 번역에서 쉽게 기대하지 않는 부분이다. 번역은 인간의 주관 판단과 맥락에 맞는 창작 능력이 발휘될 여지가 매우 큰 분야이기 때문이다.
이렇듯 번역에는 사람 역할이 필수지만 여전히 AI 번역이 빠른 시일 내 번역가를 완전히 대체할 수 있다고 여기는 사람이 많다. AI 통·번역 서비스를 제공하는 구글, 네이버 등은 인공신경망기계번역(NMT) 기술을 도입, 불과 몇 년 만에 번역 서비스 품질을 크게 끌어올렸다. NMT란 AI 스스로 머신러닝을 통해 전체 문장을 통으로 인식, 번역 결과 값을 낸다. 기업은 자사의 NMT 기술이 타사보다 뛰어나다고 홍보한다.
그러나 현재 기업이 보유한 NMT 기술에는 사실상 큰 차이가 없다. 번역 값이 다르게 나오는 이유는 기술력 차이가 아니라 각 기업이 확보한 언어 데이터 양과 질 차이 때문이다. 인공신경망 번역 서비스 알고리즘 설계를 위해서는 기본으로 코퍼스(말뭉치) 100만쌍 이상을 필요로 한다. 세부 영역별로 번역 값을 정교화하기 위해서는 더욱 많은 양의 코퍼스를 확보해야 한다. 질 좋고 다양한 재료가 있어야 요리사가 실력 발휘를 할 수 있는 것과 마찬가지다. 기술력이 아니라 양질의 번역 데이터 확보가 필수다.
그렇다면 양질의 번역 데이터는 어떻게 생성되는 것일까. 번역 데이터는 번역가 손에서 탄생한다. 끊임없이 변화하고 새롭게 생겨나는 언어는 끊임없는 작업을 통해 데이터로 변환된다. 또 상황 맥락과 작가 역량을 요하는 번역은 번역가 손길을 거쳐 더욱 적확한 표현으로 진화하고 정제된 데이터로 탈바꿈한다. 이처럼 정교하게 된 데이터는 NMT 기술의 필수 재료가 된다. 이에 따라서 일부 번역가가 야기한 인간 번역에 대한 부정 인식과 달리 번역가가 만들어 내는 데이터 가치는 여전히 중요하고, 수요는 지속 늘어날 것으로 전망된다.
현 시대 번역가 역할을 재고해 봤을 때 번역가와 AI 번역기는 어느 한쪽이 더 우수하다거나 대척점에 있는 관계가 아니다. 오히려 상호 보완하며 각각에 요구되는 니즈를 공고화시키는 관계다. AI 번역이 지속 발전하기 위해서는 번역가 손길을 거친 정제된 데이터가 필요하고, 번역가는 초벌 번역을 위해 신속하고 비용이 들지 않는 AI 번역기를 활용한다. AI 번역이 밑그림을 그린다면 그 여백을 채우는 것은 번역가의 몫이다.
이정수 플리토 대표 simon@flitto.com