한국과학기술연구원(KIST·원장 윤석진)은 물자원순환연구단 홍석원 단장과 손문 선임연구원 팀이 군집화-예측기반 인공지능(AI) 기술을 활용해 신종 미량물질을 물리화학적 특성에 따라 분류하고 농도를 예측하는 기술을 개발했다고 밝혔다.
점점 더 다양한 의약품들이 인체 대사 작용을 거쳐 하·폐수 처리장으로 유입되면서, 여기서 발견되는 미량물질 양과 종류도 증가하고 있다.
하·폐수 속 미량물질이 다시 강과 바다 등으로 유입돼 상수원으로 활용되면 환경뿐 아니라 발암, 내분비계 장애 등 건강에 해로운 영향을 미칠 수 있다. 미량물질 특성과 거동을 신속, 정확하게 예측하는 기술이 필요지만, 알려지지 않은 미량물질을 분석하는 데는 고가의 장비와 숙련된 전문가가 필요하며 오랜 시간이 걸린다.
연구진은 데이터의 유사성에 따라 지도의 형태로 군집화하는 자기조직화지도 AI 기술을 통해 의약화합물, 카페인 등 기존에 알려진 29종의 미량물질을 물리화학적 특성, 작용기, 생물학적 반응 기작 등의 정보에 따라 분류했다.
그다음, 새로운 미량물질의 특성과 농도 변화를 예측하기 위해 데이터를 여러 하위 집합으로 분류하는 머신러닝 기술인 랜덤 포레스트를 추가로 구축했다.
만약 새로운 미량물질이 자기조직화지도 내의 어떤 군집에 속한다면, 해당 군집 내 다른 물질의 특성을 통해 새로운 미량물질의 특성과 농도가 어떻게 변화할지 예측할 수 있다.
이렇게 구성된 군집화-예측 인공지능 모델(자기조직화지도-랜덤포레스트)을 새로운 13종의 신종 미량물질에 적용한 결과, 생물학적 정보를 이용한 기존 AI을 활용한 기술의 예측정확도인 0.40을 훨씬 뛰어넘는 약 0.75의 우수한 예측정확도를 보였다.
예측정확도는 0.00에서 시작하여 1.00에 가까울수록 높음.
.수식을 기반으로 하는 전통적인 예측 방법에 비해 KIST 연구팀의 데이터 기반 분석모델은 미량물질의 물리화학적 특성만 입력하면 비슷한 데이터를 가진 물질과의 군집화를 통해 새로운 미량물질의 농도가 하수처리 과정에서 어떻게 변화할지 효율적으로 파악할 수 있다는 장점이 있다.
또한, 데이터 기반의 인공지능 모델 특성상 사회적인 관심사인 마약과 같은 신종물질의 농도 예측에도 향후 활용할 수 있다.
KIST 홍석원 박사와 손문 박사(공동 교신저자)는 “실제 하폐수 처리장 뿐 아니라 신종 미량물질이 존재하는 대부분의 수처리 관련 시설에 적용할 수 있으며, 관련 규제를 위한 정책결정 과정에서 신속하고 정확한 자료를 제공할 수 있는 기술”이라며, “머신러닝 기술을 활용하기 때문에 관련 데이터가 축적될수록 예측정확도도 향상될 것”이라고 기대했다.
본 연구는 환경부 (장관 한화진) 상하수도혁신기술개발사업(2019002710010) 및 과학기술정보통신부(장관 이종호) 세종과학펠로우십 지원을 받아(2021R1C1C2005643) 수행되었으며, 연구결과는 네이처 포트폴리오 저널 클린워터(npj Clean Water, IF : 11.4, JCR 물자원 분야 상위 1.5%) 10월호에 게재되었다.
김영준 기자 kyj85@etnews.com