KT 주도 'AI 원팀' AI 기술 4종 개발

글자 작게 글자 크게 인쇄하기

딥러닝 음성합성-무빙 픽처 등
출범 10개월여 만에 첫 성과
KT 사업-현대중공업그룹 활용
산업문제 해결 선순환구조 확립

KT융합기술원 연구원이 사진을 동영상으로 가공하는 AI 무빙 픽처 기술을 시연하는 모습
<KT융합기술원 연구원이 사진을 동영상으로 가공하는 AI 무빙 픽처 기술을 시연하는 모습>

KT가 주도하는 'AI 원팀'이 공동 연구개발(R&D)을 통해 4종의 인공지능(AI) 기술을 개발했다. AI원팀 출범 10개월여 만의 첫 성과다.

AI 원팀은 개발한 AI 기술을 즉시 산업현장에 적용, 데이터활용-AI 기술 개발-상용화-산업문제 해결 선순환 구조를 만들 계획이다.

4개 기술은 △딥러닝 음성합성(P-TTS) △E2E(End-to-End) 음성인식 △무빙 픽처(Moving Picture) △AI 기반 로봇 고장 진단 기술이다. 3개 기술은 KT 사업에 활용하고, 1개 기술은 현대중공업그룹의 산업 현장에 적용할 예정이다.

KT 주도 'AI 원팀' AI 기술 4종 개발

딥러닝 음성합성(P-TTS)은 KT와 김회린 KAIST 교수가 협력·개발했다. 비용을 4분의 1 수준으로 줄이고, 속도는 10배가량 향상시킨 게 특징이다.

순서대로 음성을 만드는 방식에서 동시에 음성을 만드는 방식으로 구조를 변경, 속도를 높였다.

KT는 1분기 상용화, AI 콘택트센터(AICC)와 차세대 기가지니 등에 활용할 계획이다.

KT 주도 'AI 원팀' AI 기술 4종 개발

E2E 음성인식 기술은 KT와 장준혁 한양대 교수가 개발했다. 음성인식 정확도를 높일 수 있고, 적은 양의 학습데이터로 도메인 확장이 가능해 활용성이 크다.

최신 학습기술을 적용해 기존 하이브리드 방식에 비해 단어 오류율(WER)을 7% 이상 향상시켰다. KT는 자유발화 음성인식률을 끌어올릴 계획이다.

KT 주도 'AI 원팀' AI 기술 4종 개발

무빙 픽처 솔루션은 이미지를 영상으로 변환하는 AI 기술로, KT와 김태현 한양대 교수가 연구했다. 이미지에 모션 효과를 적용해 영상으로 바꿔준다.

영상 분할, 객체 검출, 모션 추정, 초해상도 이미지 복원(인페인팅)과 같은 최신 AI 기술을 적용했다.

KT는 무빙 픽처 솔루션을 IPTV를 비롯해 포스터, 웹툰, 애니메이티드 광고 등 다양한 분야에 활용할 계획이다.

무빙 픽처 솔루션에 적용된 핵심 기술은 국내에서 2건의 특허를 확보했고, 국제학술지(IEEE Access) 등재도 추진 중이다.

AI 기반 로봇 고장 진단 기술은 현대중공업그룹이 장준혁 한양대 교수와 개발했다. AI가 산업용 로봇 고장을 진단할 수 있는 기술로, 진동 신호에 음성처리 기술과 딥러닝 기술을 적용해 핵심 구동부품인 감속기의 이상을 탐지할 수 있다.

운전 조건에 관계 없이 적용 가능하고, 정상상태와 고장상태의 데이터 불균형을 해결해 진단 정확도를 높였다.

현대중공업그룹은 다양한 로봇 제품에 적용, 자동화 라인 유지보수 효율을 극대화할 수 있을 것으로 기대하고 있다.

AI 원팀은 4개 프로젝트에 이어 연내 AI 로봇 등 다양한 분야 7개 프로젝트를 추가 추진, AI 혁신을 위해 지속 노력할 방침이다.

송재호 KT AI/DX융합사업부문장(부사장)은 “AI 원팀이 개발한 AI 기술은 산업현장의 정확한 데이터와 최신 연구개발 역량이 즉시 결합돼 가능했다”며 “KT는 AI 원팀의 산학연 시너지를 기반으로 산업현장 현안 해결은 물론 사회문제 해결과 AI 인재 양성을 위해 노력하겠다”고 말했다.


'AI 원팀' 공동 R&D 성과

KT 주도 'AI 원팀' AI 기술 4종 개발

손지혜기자 jh@etnews.com