[대한민국 희망프로젝트]<453>머신 러닝(Machine Learning)

극장에 걸린지 13년이 된 영화라 기억이 가물거립니다. 톰 크루즈가 주연한 영화 ‘마이너리티 리포트’에 ‘프리-크라임(Pre-crime)’이라는 치안 시스템이 등장합니다. 배경은 2054년 미국 워싱턴이었던 걸로 기업납니다. 프리-크라임은 범죄가 일어나기 전 예측해 범죄자를 체포하는 최첨단 치안 시스템이죠. 기계가 스스로 학습하면서 미래를 예상하는 수준까지 진화한 것이죠. 바로 ‘머신 러닝(Machine Learning)’입니다. 영화에서는 앞으로 40년 후를 얘기하지만 늘 그렇듯이 기술개발 속도는 상상보다 빠릅니다.

영화 마이너리티의 한 장면.
영화 마이너리티의 한 장면.

Q:머신 러닝(Machine Learning)은 무엇인가요.

A:문자 그대로입니다. 기계(Machine)가 사람처럼 학습(Learning)하는 것이죠. 최근 가닥을 잡아가고 있는 빅데이터 기술에서 한 단계 진보한 형태입니다. 단순히 데이터를 수집하는 것뿐 아니라 이를 분석해 미래를 예측합니다. 컴퓨터가 마치 사람처럼 배우고 생각해 작동하게 되는 것이죠. 인공지능(AI)의 한 분야기도 합니다. 흔히 구글이나 네이버와 같은 포털사이트에서 제공하는 검색어 자동 완성 기능도 기초 수준의 머신러닝입니다. 선도 기업은 구글이라 할 수 있습니다. 8년 전부터 머신 러닝 서비스를 시작했습니다. 원래 음성인식 기능을 향상하기 위해 도입했지만 2년 전부터 검색이나 메일, 번역, 이미지 등으로 적용 분야가 확대되고 있습니다. 최근 선보인 구글 포토 서비스는 사용자 사진을 분석해 어디로 며칠간 무엇을 하고 돌아다녔는지 친절하게 이동경로까지 붙여 보여줍니다.

Q:왜 머신 러닝이 주목을 받고 있나요.

A:한 마디로 시장성이 큽니다. 기계가 사람을 대신할 수 있는 분야에 모두 적용 가능하다고 보면 됩니다. 글로벌 시장조사기관인 IDC에 따르면 머신 러닝 기술 중 하나인 음성인식 시장 규모만 올해 840억달러(97조원)에서 2017년 1139억달러(131조원)로 성장할 전망입니다. 가트너(Gartner)는 ‘주목해야 할 2015년 기술 분야’로 머신 러닝을 선정했습니다. 구글 지주회사인 알파벳 에릭 슈미트 회장은 최근 “5년 뒤 머신 러닝이 모든 산업에 적용될 것”이라고 단언키도 했습니다. 구글은 최근 일본 도쿄에서 머신 러닝 기술을 발표하면서 세간에 주목을 받았습니다. 실제로 구글 서비스 대부분은 머신 러닝 기술이 바탕입니다. 머신 러닝으로 G메일에서 스팸 메일을 99.9% 걸러내고 있습니다. 구글은 앞서 인공지능 엔진 ‘텐서플로(TensorFlow)’를 오픈소스로 공개해버렸습니다. 머신 러닝이 기계 스스로 데이터를 분류·분석하고 미래를 예측하는 기술이라면 텐서플로는 이를 가능하게 하는 알고리즘이라고 보면 됩니다. 구글이 기반 엔진을 무료 공개한 이유는 명확합니다. 안드로이드 운용체계(OS)처럼 머신 러닝 시장을 구글이 주도하겠다는 것이죠. 머신 러닝이 안드로이드 OS와 같은 플랫폼 형태가 되는 것입니다. 나머지 기업은 다양한 앱을 제작해 참여하는 거대한 생태계가 될 것으로 보입니다.

Q:머신 러닝이 그리는 미래는 어떤 것인가요.

A:머신 러닝을 적용하면 상상 속에서만 가능하던 일이 현실이 됩니다. X레이 촬영이나 MRI 정보만 갖고 정확한 진단이 가능해지는 것이죠. 빅데이터를 보유한 컴퓨터가 각종 임상 정보를 분석한 결과입니다. 실제로 미국 엠디앤더슨(MD Anderson) 암센터는 IBM 슈퍼컴퓨터를 이용해 백혈병 환자 치료법을 찾아냅니다. 400건이 넘는 백혈병 환자 사례를 입력만 하면 스스로 학습해 결과를 도출합니다. 사용자 일정을 파악해 차량에 타기만 하면 자동으로 안내합니다. 영화처럼 범죄나 사고를 예측해 미리 막아내는 것도 됩니다. 사용자 정보와 소비 패턴을 인식해 필요한 정보를 골라 보여주기도 합니다. 사진 속 얼굴만 봐도 그 사람 감정을 알 수 있습니다. 마이크로소프트(MS)는 최근 머신 러닝 기술을 활용한 감정인식 프로그램을 공개했습니다. 사진 속 얼굴을 인식해 8개 감정 상태를 수치로 보여주는 방식입니다. 페이스북도 얼굴인식 프로그램 딥 페이스를 발표했죠. 인식 정확도가 97.25%에 육박합니다. 애플이 선보인 프로액티브 어시스턴트는 아이폰에 저장한 정보로 사용자가 어떻게 행동할지 학습합니다. 국내는 네이버가 대표적이죠. 엔클라우드에서 서비스 중인 사진 분류 서비스도 머신 러닝 기능을 이용했습니다.

◇‘머신러닝’ 케빈 머피 지음. 노영찬 번역. 에이콘출판 펴냄.

[대한민국 희망프로젝트]<453>머신 러닝(Machine Learning)

기본 원칙에 입각한 모델에 기초해 머신 러닝에 접근하도록 강조한다. 이 책은 컴퓨터 과학, 통계학, 전자공학, 계량경제학, 수학적 배경 지식을 요구하는 대학교 3, 4학년과 대학원 공부를 시작하는 학생들에게 적합하다. 특히 독자가 고등 미적분과 선형 대수학, 컴퓨터 프로그래밍에 대한 기초 지식을 갖고 있다는 전제하에 구성했다.

◇‘머신러닝에서 딥러닝까지’ 곽동민·박세원·이한남 지음. 퍼플 펴냄

[대한민국 희망프로젝트]<453>머신 러닝(Machine Learning)

머신러닝에 흔히 쓰이는 알고리즘과 모델을 정리하기 위한 책이다. 알고리즘이나 기업이 다양하다보니 일일이 찾기 힘든 문제를 해결했다. 이를 위해 딥큐먼 인공지능 리서치 그룹에서 학습과 세미나를 목적으로 저자들이 각자 작성한 문서를 취합 정리했다.

유창선기자 yuda@etnews.com