KAIST, 최대 성능 280배 향상 DB 통합기술 '키마이라' 개발

키마이라 개발 연구팀. (왼쪽부터)박정호 그래파이 엔지니어, 이건호 박사과정, 김민수 교수
키마이라 개발 연구팀. (왼쪽부터)박정호 그래파이 엔지니어, 이건호 박사과정, 김민수 교수

데이터 저장부터 질의 처리까지 전 과정을 하나로 통합한 세계 최초 그래프-관계형 DB 시스템이 개발됐다. 이를 통해 인공지능(AI)은 단순 검색을 넘어 복잡한 연결 관계까지 실시간으로 추론할 수 있어 한층 똑똑한 AI 서비스 구현이 가능해질 전망이다.

한국과학기술원(KAIST)은 김민수 전산학부 교수 연구팀이 관계형 DB와 그래프 DB를 완전 통합해 그래프-관계형 질의를 한층 효율적으로 실행할 수 있는 새로운 DB 시스템 '키마이라(Chimera)'를 개발했다고 8일 밝혔다.

기존 관계형 DB와 달리 그래프 DB는 데이터를 정점(노드)과 간선(연결선)으로 표현하는 구조를 가지고 있어 사람·사건·장소·시간처럼 복잡하게 얽힌 정보를 분석하고 추론하는 데 강점을 지닌다. 이 특징으로 최근 AI 에이전트, 소셜네트워크서비스(SNS), 금융, 전자상거래 등 다양한 분야에서 활용이 증가하고 있다.

이와 함께 관계형 DB와 그래프 DB 간 복합 질의 처리 수요가 커지면서 관계형 질의 언어(SQL)에 그래프 질의 기능을 확장한 신규 표준 언어 'SQL/PGQ'도 제안됐다.

SQL/PGQ는 기존 데이터베이스 언어(SQL)에 그래프 탐색 기능을 추가한 새로운 표준 언어로, 표(테이블) 형태의 데이터와 사람·사건·장소 등 연결 관계 정보를 한 번에 질의(검색)할 수 있도록 설계됐다.

다만 지금까지 접근 방식은 그래프 탐색을 억지로 조인 연산으로 흉내 내거나, 메모리에 그래프 뷰를 미리 구성해 처리하는 방법에 의존했다. 탐색 단계가 깊어질수록 성능이 급격히 떨어지고, 데이터 규모가 조금만 커져도 메모리 부족으로 실행이 실패한다. 또 원본 데이터 변경이 뷰에 즉시 반영되지 않아 데이터 최신성이 떨어지고, 관계형 결과와 그래프 결과를 따로 결합해야 하는 비효율이 뒤따랐다.

키마이라는 이러한 한계를 근본적으로 해결했다. 연구팀은 그래프 전용 저장소와 관계형 데이터 저장소를 함께 운영하는 '듀얼 스토어 구조'를 도입했다. 여기에 그래프 탐색과 관계형 연산을 동시에 처리하는 '탐색-조인 연산자'를 적용해 복잡한 연산을 단일 체계에서 효율적으로 실행할 수 있도록 했다.

그 결과 국제 성능 표준 벤치마크인 LDBC Social Network Benchmark(SNB)에서 기존 시스템 대비 최소 4배에서 최대 280배 빠른 성능을 기록하며 세계 최고 수준을 입증했다.

그래프 데이터 규모가 커져도 메모리 부족으로 인한 질의 실패가 발생하지 않으며, 뷰를 사용하지 않기 때문에 데이터 최신성 측면에서도 지연 문제가 없다.

김민수 교수는 “데이터 간 연결 관계가 갈수록 복잡해지는 만큼, 그래프와 관계형 DB를 아우르는 통합기술 필요성이 커지고 있다”며 “키마이라는 이 문제를 근본적으로 해결한 기술로, 앞으로 AI 에이전트, 금융, 전자상거래 등 다양한 산업에서 널리 쓰일 것으로 기대한다”고 말했다.

이번 연구성과는 지난 1일 세계적 권위의 데이터베이스 분야 국제학술대회 VLDB에서 발표됐다. 이 기술은 그래파이가 출시 예정인 벡터-그래프-관계형 DB 시스템 'AkasicDB'에 적용돼 RAG 기반 고성능 AI 에이전트(검색 능력을 갖춘 똑똑한 AI 비서) 구현을 위한 핵심기술로 활용될 예정이다.

이인희 기자 leeih@etnews.com