[사이언스 인 미디어]'스타트업'의 이미지 인식 대회, 현실에서는?

글자 작게 글자 크게 인쇄하기
드라마 스타트업 포스터. 출처 : TVN 공식페이지
<드라마 스타트업 포스터. 출처 : TVN 공식페이지>

“눈이 좋아질 수 없다면 기술로 대신해 보는 것은 어때?”

드라마 스타트업의 주인공 남도산은 자신이 좋아하는 서달미의 할머니를 위해 시각장애인용 애플리케이션(앱) '눈길'을 개발한다. 남도산은 인공지능(AI) 기반 이미지 인식 기술 대회에서 우승을 차지할 정도로 천재 개발자다.

현실에서도 극중과 같이 AI 기반 이미지 분류대회인 'ILSVRC'(ImageNet Large-Scale Visual Recognition Challenge)가 2010년부터 진행돼 왔다. 대회에서는 각각 이름표가 붙어 있는 1000만개 이상 대규모 이미지를 보유한 데이터셋을 기반으로 해당 이미지를 인식·분류한다.

2011년 대회까지는 컴퓨터 이미지 인식률이 75%를 채 넘지 못했다. 하지만 2012년 대회에서 현재까지 큰 영향을 미치고 있는 새로운 기술이 탄생했다. 제프리 힌튼 캐나다 토론토대 교수팀의 알렉스 크리제브스키가 GPU(그래픽 처리장치) 기반 딥러닝 기술 '알렉스넷'을 가지고 등장한 것이다.

당시 1등을 차지한 알렉스넷의 이미지 인식 오류율은 15%에 불과했다. 해당 대회에서 2등 팀의 인식 오류율이 26.2%였던 것에 비해 엄청난 인식률을 자랑한 것이다. 기존에는 수십일이 걸렸던 AI 학습 기간도 5~6일로 단축시켰다.

알렉스넷은 뇌 구조를 본딴 인공신경망 모델인 나선형신경망(CNN)을 사용해 심층신경망(Deep Neural Network)을 구현했다. 기존 머신러닝에서 CPU를 활용했던 것에 비해 알렉스는 병렬 연산을 고속으로 처리해 동시다발적인 연산에 유리한 GPU를 딥 러닝 연구에 활용한 것이다.

알레스넷은 GPU 기반 딥 러닝으로 기존의 머신러닝을 한 단계 발전시키는 계기가 됐다. 알렉스넷 이후 GPU 기반 딥 러닝 기술이 꾸준히 개발되면서 현재 ILSVRC에 참여하는 팀은 인간의 이미지 인식률은 뛰어넘는 결과를 보여주고 있다.

드라마 스타트업에서 남도산은 눈길에 적용한 이미지 인식 기술을 추후 자율주행 기술에 적용시키기도 한다. 현실에서도 점점 더 발전하고 있는 딥러닝 기반 이미지 인식 기술이 앞으로 주변 환경 인식이 중요한 자율주행 기술에서부터 미세한 오류까지 찾아내야 하는 제조업 분야 등 다양한 분야에 적용될 수 있을 것이다.

정예린기자 yeslin@etnews.com