언어처리 프로그램용 우리말 전자사전이 개발됐다.
문화관광부는 18일 국어정보화사업인 ‘21세기 세종계획’ 가운데 기초자료구축, 전자사전개발, 한민족 언어정보화, 전문용어 정비 등 국어정보화 기반 구축과 글꼴개발 보급 지원, 문자코드 표준화 연구, 인력 양성 등 국어정보화 여건 조성 2단계 사업을 마무리 지었다고 밝혔다. 표 참조
지난 98년부터 총 187억원을 투입, 오는 2007년까지 10년간 3단계에 걸쳐 시행되고 있는 ‘21세기 세종계획’은 우리말을 통한 음성인식, 자동 번역, 문서요약 등 언어처리 프로그램이 구동될 수 있도록 국어 정보자료를 구축해 편리하게 활용할 수 있는 국어 정보화기반 조성 사업이다.
이번에 개발된 전자사전은 1차 상용화 버전으로 컴퓨터가 언어처리 과정에서 단어의 의미, 문법, 형태소 등에 의문이 생길 때 컴퓨터가 스스로 물어 해결할 수 있으며 체언, 부사, 연어, 관용표현, 특수어 사전 등 13개 하위 사전으로 구성돼 있다. 현재 기본정보 26만5000 어휘, 상세정보 9만3000 어휘가 수록돼 있으며 앞으로 3단계 사업에서 총 70만개의 기본 정보가 담길 수 있도록 할 예정이다.
문화부는 이번에 개발된 전자사전을 미래 유망산업인 문서 자동처리기, 번역기, 웹 검색, 언어학습기 개발 등 언어공학 산업에 활용할 계획이다.
국어 기초자료 구축 사업으로 현대국어, 구어, 한일, 한영병렬 등 말뭉치 1억6800만 어절을 구축했으며 용례추출기, 지능형 형태소 분석기, 구문 분석기 등 7종의 소프트웨어도 개발완료했다.
또 한민족 언어정보화 사업으로 어문규정 검색시스템, 남북한 언어비교사전, 남북한 방언·국어어휘 역사검색 시스템 등을 개발했으며 남북한 정서법 변환 프로그램도 개발 완료했다.
국어정책과 유병한 과장은 “이번 ‘21세기 세종계획’ 2단계 완료로 국어가 급변하는 경제환경에 적합한 언어로 거듭나게 됐으며 언어의 국제경쟁력 확보도 이룰 수 있게 됐다”고 말했다.
문화부는 오는 23일 서울 삼성동 코엑스에서 ‘21세기 세종계획’ 2단계 사업보고회를 갖고 그동안 개발된 프로그램을 무상 배포할 예정이며 3단계 사업계획은 전문가 의견을 수렴해 3월중 최종 확정할 예정이다.
<이경우기자 kwlee@etnews.co.kr>