멀티모달 AI 전문 기업 ‘㈜액션파워’(공동대표 조홍식, 이지화)가 최근 회사 연구팀의 논문이 세계 최고 권위의 학회인 INTERSPEECH(음성신호처리학회), ICASSP(신호처리국제학술대회), ACL(컴퓨터언어학협회)에 연이어 등재되었다.
INTERSPEECH와 ICASSP(International Conference on Acoustics, Speech, and Signal Processing)는 해마다 수천 명의 세계적인 AI 전문가들이 최신 연구 성과를 공유하는 음성·음향·신호처리 분야의 국제 학회로, 세계 최대 규모를 자랑한다. 올해 61년째 개최된 ACL(Association for Computational Linguistics) 역시 세계적인 학술대회이며, 자연어처리(NLP) 등 컴퓨터 과학 전문가들이 최신 연구와 기술에 대해 공유하는 장이다.
액션파워는 인공지능 지식 관리 앱 ‘다글로’를 중심으로, NLP, ASR 원천 기술 연구와 서비스 개발을 동시에 추구해왔다. 최근 비전 분야로 영역을 넓히면서, 지난 3년간 INTERSPEECH를 포함한 해외 최고 권위 학회에 7편의 논문을 발표해왔으며, 이러한 연구 내용으로 기반으로 국내 특허 21개, 해외 특허 2개를 보유하고 있다. 출원 중인 특허도 국내 18건, 해외 11건으로, 기술 기업으로서 핵심 경쟁 역량을 강화하며 적극적인 연구, 개발 사업을 진행 중이다.
박성민 NLP 리서치팀장은 올해 두 개의 자연어 처리 관련 논문을 INTERSPEECH 2023, ACL 2023에서 발표했다.
ACL 2023에서는 텍스트 데이터에 자동으로 주제를 표시하는 기술이 발표됐다. 이 ‘Pseudo-labeling ’기법을 이용하면, 문단의 마지막이나 글의 마지막에 ‘이 글은 00에 대한 글이다’라는 문장이 추가되며 실제 내용과 추가한 문장의 설명이 자연스럽게 연결되어 해당 글을 ‘00에 대한 글’로 labeling하게 된다. 이 기술을 이용하면 머신러닝의 속도를 대폭 개선할 수 있다고 전했다.
김경호 NLP 담당 연구원은 ICASSP 2023에 생성 AI를 통해 VQA(Visual Question and Answering) 모델의 학습 프로세스를 혁신하는 연구결과를 발표했다. 이번 연구는 질문과 정답을 프롬프트로 사용해서 여러 개의 이미지를 생성함으로써 원본뿐 아니라 수많은 이미지 데이터를 학습에 입력하는 방법을 고안한 것으로, 그동안 이미지 데이터를 구하기 어려웠던 여러 연구자들에게 도움이 될 수 있다. 이 기술을 적극적으로 활용하면 이미지 데이터에 관련된 인공지능의 발전 속도를 크게 높일 수 있을 것으로 기대된다고 밝혔다.
이지화 액션파워 공동대표 겸 CTO는 “이번 연구는 자연어 처리와 이미지 처리의 수준을 높이고 학습 과정의 효율을 크게 개선했다는 점에서 액션파워의 성장을 한 단계 더 이끌었다고 볼 수 있다”라며 “이러한 연구 결과들은 우리가 제공하는 다글로 서비스 외 B2C, B2B로 제공할 여러 분야의 혁신적인 서비스로 이어질 것”이라고 말했다.
이어 “세계에서 인정받는 자체 기술을 바탕으로 일상 속 혁신을 경험할 수 있는 서비스를 제공하기 위해 앞으로도 꾸준히 노력하겠다”라며 “특히 최고 수준의 인재를 지속적으로 영입하여 연구의 수준을 더욱 끌어올리기 위해 아낌없이 투자할 예정”이라고 덧붙였다.
전자신문인터넷 서희원 기자 shw@etnews.com
-
서희원 기자기사 더보기