AI 모델 강건성 높여주는 데이터 증강 조건 규명

윤성환 UNIST 교수팀
효과적 증강 기법 채택해 AI 모델 개발 생산성 향상

윤성환 교수(좌측)와 유위범 연구원
윤성환 교수(좌측)와 유위범 연구원

데이터 증강 조건 변화에 따라 인공지능(AI) 모델의 강건성을 높일 수 있다는 연구 결과가 나왔다.

윤성환 울산과학기술원(UNIST) 인공지능대학원 교수팀은 AI 학습의 필수 단계인 데이터 증강에서 AI 모델의 강건성을 높일 수 있는 조건을 수학적으로 증명했다고 19일 밝혔다.

AI 모델의 '강건성'은 미세 데이터 이탈이나 외래값에 영향을 받지 않고 우수한 성능을 발휘하는 특성이다. 눈보라 속에서 차선을 이탈하지 않는 자율주행차, 저화질 사진으로도 암을 진단하는 의료 AI 등을 만들기 위해서는 AI 모델의 강건성이 뛰어나야 한다.

현재 AI 딥러닝 모델은 학습 데이터와 조금만 다른 환경에 노출되면 성능이 급격히 저하하는 약점을 안고 있다. 원본 데이터에 인위적으로 변형을 가해 학습량을 늘리는 데이터 증강이 필수적인 이유다.

하지만 어떠한 데이터 변형 방식이 가장 효과적인지는 명확히 밝혀진 게 없다 보니, 수많은 시행착오를 반복해야만 했다.

PSA 조건을 만족하는 데이터 증강이 평탄한 최소점을 형성하는 과정
PSA 조건을 만족하는 데이터 증강이 평탄한 최소점을 형성하는 과정

윤 교수팀은 이번 연구에서 근접지지증강(PSA)이라는 조건에 만족할수록 더 높은 데이터 증강 효과를 거둘 수 있다는 것을 밝혀냈다. PSA는 원본 데이터에 미세한 변형을 가해 원본 데이터 주변을 촘촘히 채우는 방식이다.

윤 교수팀은 먼저 데이터 공간과 파라미터 공간에서 변화가 서로 대응된다는 점을 증명한 뒤, PSA 조건을 만족하는 데이터 공간에서의 변화가 파라미터 공간의 손실함수 지형을 평평하게 다져준다는 사실을 입증했다. 입력 데이터 주변을 촘촘히 채우면, 이에 대응하는 모델 내부의 파라미터 공간도 평평해져 결과적으로 AI의 강건성이 높아진다는 것이다.

윤성환 교수는 “실제 실험에서 PSA 조건을 충족한 데이터 증강 기법이 그렇지 않은 기법보다 월등히 높은 강건성을 나타내는 것을 확인했다”며 “자율주행, 의료 영상, 제조 검사처럼 데이터 분포가 자주 바뀌는 환경에서 신뢰할 수 있는 AI 모델을 만드는 데 중요한 이론적 기반이 될 것”이라고 말했다.

이번 연구는 오는 20일~27일까지 싱가포르에서 열리는 '전미인공지능학회(AAAI) 2026'에 정식 논문으로 소개된다.

울산=임동식기자 dslim@etnews.com