[과학산책]사람 같은 컴퓨터

이달 초 영국 리딩대에서 튜링 검사를 통과한 프로그램의 출현이 대대적으로 소개됐다. 튜링 검사란 기계에 인간 정도의 지능이 있는지를 확인하는 절차로, 컴퓨터과학의 기초를 닦은 영국인 수학자 앨런 튜링이 고안한 것이다.

조환규 부산대 컴퓨터공학과 교수
조환규 부산대 컴퓨터공학과 교수

컴퓨터라는 개념조차 모호했던 1950년, 앨런 튜링은 전기회로에서 학습이 가능한 지능의 가능성을 발견했다. 기계에 지능과 학습능력을 어떻게 심어줄 것인지 그리고 기계의 지능을 어떻게 검증할 것인지 이 두 가지가 튜링의 궁극적 고민이었다. 튜링은 조작적 정의(operational definition)에 기초해 기계가 가진 지능을 정의하고자 했다. 추상적 개념이 아니라 측정할 수 있는 구체적 방법으로 지능을 정의하기 위해 튜링 검사를 고안했다.

튜링 검사에는 칸막이를 사이에 두고 기계(컴퓨터)와 사람 그리고 검사관이 참여한다. 검사관인 사람이 칸막이 너머로 질문을 던지고 이 질문에 무작위로 컴퓨터 또는 사람이 답을 한다. 검사관의 역할은 자신이 던진 질문에 답한 주체가 컴퓨터인지 사람인지를 구분해내는 것이다. 검사관은 사람과 기계의 구분이 가능하도록 질문을 꾸며야 하고, 반대로 프로그램은 검사관의 판단이 최대한 헛갈리도록 인간과 유사한 답을 해야 한다.

1950년대에는 지금과 같은 음성인식이나 합성 장치가 없었기 때문에 튜링 검사의 오리지널 버전에는 지금의 채팅과 같이 문자만 허용됐다. 이때 던진 질문의 30% 이상에서 검사관이 기계와 사람의 구분을 헛갈렸다면 그 기계에는 지능이 있다고 봐야 한다는 것이 튜링의 주장이다. 왜 30%를 그 기준으로 삼았는지는 불분명하지만 그 당시의 과학 수준으로 볼 때 이런 미래 지향적 제안은 튜링의 천재성을 잘 보여주고 있다.

리딩대의 이번 튜링 테스트에 사용된 소프트웨어는 두 명의 러시아 연구자가 만든 유진 구츠만(Eugene Goostman)이라는 채팅 프로그램이었다. 30명의 검사관들이 5분 동안 질문을 던져 그 답을 보낸 개체가 사람인지 기계인지를 판단하게 한 결과 33%의 질문에 대해 이 프로그램은 검사관을 속이는 데 성공했다.

흥미로운 점은 이 프로그램이 우크라이나 출신의 열 세 살짜리 소년 역할을 하도록 설정돼 있는 것이다. 이 때문에 이번 성공에 부정적인 의견도 많다. 우크라이나 출신으로 가정한 것은 영어에서 서툰 점을, 열 세 살 소년으로 설정한 것은 수준 높은 질문을 회피할 수 있는 기능을 했다. 이번 리딩대의 튜링검사는 지능을 가진 보편적 기계의 탄생이라기보다는 13세 이민자 소년의 수준은 기계로 가능하다는 것을 말해줄 뿐이다. 물론 사람과 같은 자기학습 능력은 아직 확인되지 않고 있다.

이번 일은 튜링 서거 60주년을 기념해 리딩대가 보여준 이벤트 성향이 짙지만, 이제 인간과 기계의 구분이 어려운 새로운 사이버 범죄시대가 도래할 것이라는 점에서 작은 의미가 있다. 피싱 전화 범죄가 사회적으로 큰 문제가 되고 있는데 앞으로는 더 지능적이고 교묘한 채팅 프로그램으로 진화될 가능성을 이번 검사가 보여준 것이다.

이미 독일에서는 변태 유아성애자를 수사하기 위해 유인하는 자동 채팅프로그램을 사용 중이다. 그러나 이미 1991년에 와인트라웁이 개발한 PC-테라피스트 프로그램은 튜링 검사 성공률을 50% 가까이 보였으며, 2011년에 출시된 클레버봇(CleverBot) 프로그램은 무려 60%의 성공률을 보였다. 최근에는 문자 채팅을 넘어서 제시된 그림에 관련된 질문을 던져 대답의 주체가 기계인지 사람인지를 구별하는 튜링검사 2.0 판도 제시되고 있다.

가짜 트위터 계정이라든지 가공인물로만 구성된 사기성 페이스북이 점점 사회 문제화되고 있음은 이미 인간과 기계 사이의 경계가 허물어지고 있음을 잘 보여주고 있다. 인간보다 더 인간적인 사이보그가 등장하는 영화 ‘블레이드러너’와 같은 현실은 생각보다 빨리 다가올 것이다.

조환규 부산대 컴퓨터공학과 교수 hgcho@pusan.ac.kr