KAIST, 그래프 분석 AI '플렉스GNN' 개발...학습 속도 95배 향상

기존 시스템과 이번 기술 실행 흐름 비교
기존 시스템과 이번 기술 실행 흐름 비교

금융 거래, 주식, 환자기록 등 비정형 데이터를 그래프 형태로 분석하는 그래프뉴럴네트워크(GNN) 기반 그래프 인공지능(AI) 모델 활용이 활성화되는 가운데, 한국과학기술원(KAIST·총장 이광형)이 단 한 대 그래픽처리장치(GPU) 서버만으로도 대규모 GNN 모델을 최고속 학습할 수 있는 세계 최고 성능 소프트웨어(SW) 기술을 개발했다. 전체 그래프를 한 번에 학습(풀 그래프 학습)하는데 막대한 메모리, GPU 서버가 필요한 문제를 해결했다.

KAIST는 김민수 전산학부 교수팀이 한 대 GPU 서버에서 대규모 풀 그래프 AI 모델을 빠르게 학습하고 추론할 수 있는 플렉스GNN(FlexGNN)을 개발했다고 13일 밝혔다.

풀 그래프 학습은 정확도가 우수한 반면, 대규모의 중간 데이터가 학습중 발생해 메모리 부족 현상이 빈번하다. 여러 서버 간 데이터 통신으로 학습 시간도 길어진다.

연구팀은 이런 문제를 극복하고자 단일 GPU 서버에서 솔리드 스테이트 드라이브(SSD)와 메인 메모리를 활용한 최적의 AI 모델 학습을 수행케 했다.

특히 데이터베이스(DB) 시스템 질을 최적화시키는 'AI 퀴리 최적화 학습'으로 GPU-메인 메모리-SSD 계층 간 모델 파라미터, 학습 데이터, 중간 데이터 학습 최적화 기술을 개발했다.

이에 데이터 크기, 모델 규모, GPU 메모리 등 가용 자원 상황에 따라 유연하게 최적 학습 실행 계획을 생성해 높은 자원 효율성과 학습 속도를 구현했다.

그 결과, 메인 메모리 용량을 초과하는 데이터도 학습하며, 단일 GPU 서버에서도 최대 95배 빠르게 학습이 가능해졌다. 기후 예측 등에서 슈퍼컴퓨터보다 정밀한 분석이 가능한 풀 그래프 AI 구현이 현실화됐다.

김민수 교수는 “날씨 예측과 신소재 발견 등 복잡한 문제를 해결하는데 풀 그래프 GNN 모델이 활발히 활용되면서 관련 기술 중요성이 높아지고 있다”며 “플렉스GNN이 그동안 어려움으로 남아 있던 그래프 AI 모델 학습 규모·속도 문제를 해결한 만큼, 다양한 산업에 널리 활용되기를 기대한다”고 밝혔다.

이번 연구는 배정민 KAIST 전산학부 박사과정이 제1 저자로, 김민수 교수창업기업인 그래파이의 한동형 CTO가 제2 저자로 참여했으며, 김 교수가 교신저자를 맡았다.

연구 결과는 세계적 권위의 데이터마이닝 학술대회 'ACM KDD'에서 지난 5일 발표됐다. 기술은 향후 그래파이 그래프 DB 솔루션 그래프온(GraphOn)에도 적용될 예정이다.

김영준 기자 kyj85@etnews.com