현인정보(대표 한민호)는 18일 새로운 알고리듬의 한글 형태소 분석기와 색인 자동추출시스템을 장착한 자연어 전문 정보검색시스템인 「마이다스(MIDAS) 1.2」를 개발 완료하고 본격 공급에 나선다고 밝혔다.
부산여대 최재혁 교수팀과 1년에 걸친 공동연구 끝에 개발한 이 시스템은 한글 형태소 분석때 「양방향 최장 일치법」을 채택해 정확도와 처리속도를 대폭 향상시켰다.
현인정보는 이 시스템이 22만 단어의 기본사전을 내장하고 있으며 양방향 최장 일치법의 적용결과, 어절당 사전 검색횟수가 대폭 감소됐다고 밝혔다.
또 이 알고리듬을 색인어 자동추출시스템에 적용시킨 결과 어휘사전 참조도는 한글의 경우 기존 태뷸러 방식(Tabular Method)의 10.6회에서 1.91회로 약 82%가 증가했으나 음절정보분석법의 3.57회에 비해서는 약 47%가 감소됐다고 덧붙였다.
이밖에 영어 색인어 추출시스템 또한 한국어 색인 추출시스템의 설계 목적과 동일하게 색인어 추출의 정확도를 보증하면서 사전 참조횟수를 줄여 전체 시스템의 수행시간을 감소시켰다.
이 회사는 오는 9월까지 「마이다스 1.2」에 「자동 띄어쓰기」 교정시스템을 적용해 자동색인 속도를 한층 더 강화할 방침이다. 문의 578-7771
<김상범 기자>