[KAIST AI를 선도한다]AI, '가짜뉴스'도 판별... 다른 학문 가미해 사회문제 해결]

발행일 : 2017-04-30 17:00 지면 : 2017-05-01 5면

인공지능(AI)은 날이 갈수록 활용 영역을 확장한다. 과거에는 한정된 분야에서만 데이터를 처리했지만 이제는 다양한 분야에서도 빅데이터78가 쌓이면서 우리 삶 전반에 큰 변화가 일고 있다. 드론352, 자율주행자동차, 생산자동화 등 익히 알려진 분야는 물론 사회를 구성하는 다양한 분야와 융합해 활용도를 높여 가고 있다.

KAIST(총장 신성철)도 AI를 주제로 '연구 혁신'의 기치를 내걸었다. AI 기반 기술을 세분화, '10대 전략 연구 분야 및 추진 과제'를 도출했다. AI를 공학에 이용하고 정보통신기술(ICT785) 분야에 적용하는 기술을 기본으로 담았다. 여기에 사회 각계각층에서 발생하는 문제를 해결하는 AI 활용 기술을 포함시켰다. 그동안 다른 학문으로만 여겨 온 인문·사회 분야와도 융합, 사회에 도움이 되는 AI 결과물을 생산한다.

최근 '4월 전쟁설'이 떠돌았다. 또 한 차례 남북전쟁을 겪을 수 있다는 루머가 온 국민을 떨게 했다. 미국과 북한 간 긴장 관계, 군사 행동도 영향을 미쳤다. 그러나 '가짜뉴스'의 영향이 컸다. 해외에서는 '3차 세계대전'이 곧 시작된다는 가짜뉴스가 퍼지고 있다. 이 가짜뉴스는 지난 26일부터 소셜 뉴스 웹사이트 '레딧'에서 전파돼 2000회 이상 '추천'을 받았다.

지난해 미국 대통령 선거에서는 '교황이 트럼프를 지지한다'거나 '힐러리가 이슬람수니파무장단체(IS)에 미국산 무기를 팔았다'는 가짜뉴스가 사회관계망서비스(SNS)를 통해 전파됐다. 사람들은 가짜뉴스를 진짜뉴스보다 더 많이 봤다.

KAIST는 올해부터 AI로 가짜뉴스를 탐지·판별하는 기술을 10대 연구 혁신 추진 과제에 포함시켜 중점 연구한다. 사회를 좀먹고 대중의 오해를 부르는 가짜뉴스를 AI로 탐지한다. AI 활용 저변을 넓히자는 취지다. 이를 시작으로 '문제 해결형 연구'에 AI를 적용해 나갈 계획이다.

가짜뉴스 AI 탐지 기술은 차미영 문화기술대학원 교수 연구팀이 맡았다. 차 교수는 권세정 박사 및 정교민 서울대 교수와 함께 AI로 구현할 수 있는 학습, 추론, 지각, 자연어 이해 기술을 고도화했다. 기술의 핵심은 각각의 정보가 담고 있는 '진실성'을 패턴화, 머신러닝(기계학습)에 적용하는 것이다.

연구팀은 분산 서버 50대를 연결해 세계 5000만 트위터 사용자가 생산한 20억개 메시지와 20억개 팔로우 링크를 수집, 분석했다. 대량의 정보를 쉽게 얻을 수 있는 영어 기반 정보를 우선 취득했다. 이에 바탕을 두고 72건의 루머와 58건의 일반 뉴스를 가려내 가짜뉴스의 특징을 밝혔다.

해외 루머를 수집해 놓은 '스눕스닷컴' 자료도 활용했다. 수집한 빅데이터는 가짜뉴스와 진짜뉴스의 패턴 차이를 확인하는 기반이 됐다. 진짜뉴스는 사실이 한 번 전파된 후 대중의 관심에서 멀어지면 사라진다. 그러나 가짜뉴스는 전파자들의 광고 또는 어젠다 형성을 위해 지속 재생산됐다.

이런 '전파 모델'은 수집 정보와 함께 AI가 정보의 진위성을 판단하는 주요 기준이 된다. 판별 대상 정보가 전파되는 추이를 기존 모델과 비교하면 진위를 가려 낼 수 있다.

루머와 일반 정보의 전파모델 차이, 루머는 지속적으로 정보가 생성되는 반면, 일반정보는 대중의 관심이 떨어지면 활동성을 잃게된다.

연구팀은 가짜뉴스 탐지 AI에 다른 학문의 영역도 가미, 정확도를 높였다. 팀에 국어국문, 극영화, 경영학 등 다양한 학문을 공부한 학생들을 포함시킴으로써 학문의 저변을 넓혔다.

우선 루머 대부분이 불명확한 '회피성 언어'를 사용한다는 사실에 착안했다. '어디서 들었는데' '확실하지 않지만' '루머일 수 있지만' 등 언어 패턴에 바탕을 두고 '감성 분석 알고리즘'을 구축, 활용했다. 기존의 사회학 이론으로 데이터를 수치화하는 작업도 병행했다. 군중심리학, 사회심리학 같은 사회학에서 정의한 루머의 요건·특징·영향을 수치화함으로써 AI 알고리즘의 정확도를 높였다.

연구팀은 자체 개발한 가짜뉴스 탐지 기술이 90%의 정확도를 보인다고 설명했다. 최근 각광받고 있는 딥러닝 기술도 적용할 수 있다. 현재 수준으로는 70%의 정확도를 보이지만 단 30개의 메시지만 보고도 진위를 판단할 수 있다.

이 기술은 그동안 사람이 주로 해 온 온라인 '팩트 체크' 과정을 단순화할 수 있다. SNS 확대에 힘입어 기하급수로 늘어나고 있는 정보와 의견 관리를 효율화하고 가짜뉴스나 루머를 사전에 배제, 사회 불안 및 피해를 방지할 수 있을 것으로 기대된다.

연구팀의 연구 결과는 ICDM(IEEE136 국제 데이터 마이닝 콘퍼런스), IJCAI(국제 AI 콘퍼런스), PLOS One(미국 공공과학 학술지) 등을 통해 소개됐다. 지난해 한국정보과학회 동계학술대회에서 우수상을 받기도 했다. KAIST는 올해 이 연구에 3억원을 지원한 데 이어 앞으로 계속 추가 지원할 예정이다.

차 교수는 “AI 기반의 가짜뉴스 탐지 기술은 첨단 AI를 사회 문제 해결에 활용하는 대표 사례가 될 것”이라면서 “다른 학문과 융합하는 학제 간 공동 연구 가능성도 높여 줄 것”이라고 기대했다.

<가짜뉴스 분석 특성>

<AI 기반 가짜뉴스 탐지기술에 사용된 사회 이론>

<AI 기반 가짜뉴스 탐지기술의 정보 생성일별 탐지 정확도> (단위:%)

[KAIST AI를 선도한다]AI, '가짜뉴스'도 판별... 다른 학문 가미해 사회문제 해결]

슈퍼솔루션, HBM3E 메모리 탑재 HGX B200 플랫폼 적용 기가바이트 서버 발표

[슈퍼솔루션] 뉴스룸 바로가기>

대전=김영준기자 kyj85@etnews.com

경제 공공 빅데이터 서버 세미나 소셜네트워크 인터넷 한국과학기술원 CT OS