KAIST, 딥러닝 기반 실시간 '기침 인식 카메라' 개발

글자 작게 글자 크게 인쇄하기

한국과학기술원(KAIST·총장 신성철)은 박용화 기계공학과 교수팀이 에스엠 인스트루먼트(대표 김영기)와 함께 실시간으로 기침 소리를 인식하고 기침하는 사람 위치를 이미지로 표시해주는 `카메라'를 개발했다고 3일 밝혔다.

연구팀은 기침 소리를 실시간으로 인식하는 딥러닝 기반 기침 인식 모델을 개발했다. 또 열화상 카메라와 같은 원리로 기침 인식 모델을 음향 카메라에 적용, 기침 소리와 기침하는 사람의 위치, 심지어 기침 횟수까지를 실시간으로 추적하고 기록 가능하도록 했다.

연구실환경에서 기침 인식카메라의 기침 발생 위치표시
<연구실환경에서 기침 인식카메라의 기침 발생 위치표시>

연구팀은 기침 인식 카메라가 사람이 밀집한 공공장소에서 전염병의 유행을 감지하거나 병원에서 환자의 상태를 상시 모니터링 가능한 의료용 장비로 활용될 것으로 기대하고 있다.

기침 인식 모델에는 합성 곱 신경망(CNN)을 기반으로 지도학습을 적용했다. 1초 길이 음향신호 특징을 입력 신호로 받아, 1(기침) 또는 0(그 외)의 2진 신호를 출력하고 학습률 최적화를 위해 일정 기간 학습률이 정체되면 학습률 값을 낮추도록 설정했다.

구글과 유튜브 등에서 연구용으로 활발히 사용 중인 '오디오세트(Audioset)'를 비롯한 데이터 세트를 수집했다.

데이터 증강을 위해 배경 소음을 15~75% 비율로 오디오세트에 섞은 후, 다양한 거리에 적응할 수 있게 음량을 0.25~1배로 조정했다. 훈련 및 평가 데이터 세트는 증강된 데이터 세트를 9:1 비율로 나눠 구성했으며, 시험 데이터 세트는 따로 사무실에서 녹음한 것을 사용했다.

모델 최적화를 위해서는 '스펙트로그램(spectrogram)' 등 5개의 음향 특징과 7개의 최적화 기기를 사용해 학습을 진행하고 시험 데이터 세트의 정확도를 측정했다. 성능을 확인한 결과 87.4%의 시험 정확도를 얻을 수 있었다. 추후 병원 등 실사용 환경에서 추가 학습이 이뤄진다면 정확도는 더 높아질 전망이다.

박용화 교수는 “코로나19가 지속적으로 전파되고 있는 상황에서 공공장소와 다수 밀집 시설에 기침 인식 카메라를 활용하면 전염병의 방역 및 조기 감지에 큰 도움이 될 것”이라며 “병실에 적용하면 환자 상태를 24시간 기록해 치료에 활용할 수 있다”고 말했다.

대전=김영준기자 kyj85@etnews.com