인공지능(AI) 관련 시장에서 성장세가 주목 받는 분야 중 하나가 합성데이터 시장이다. 가트너는 전세계 시장이 매년 23%씩 성장해 2026년에는 AI학습에서 합성데이터 사용비율이 실제 데이터 사용비율을 넘을 것으로 전망했다.
합성데이터는 가상의 데이터이다. 합성데이터가 필요한 이유는 AI 성능 고도화를 위해서이다. AI를 제대로 활용하려면 관련 데이터가 많이 필요한데 현실에 데이터가 없으니 이 데이터를 합성으로 만들어주는 것이다. 예를 들어 헬스케어 분야에서 사람의 CT 사진 등이 많아야 하는데 개인정보 등의 문제 때문에 쉽게 구할 수가 없는 것이 현실이다. 이 때 입수할 수 있는 제한된 현실 데이터를 바탕으로 가상의 데이터인 합성데이터를 만들면 AI 고도화가 가능해진다.
국내에서도 AI에 대한 투자가 늘어나면서 합성데이터를 만드는 비즈니스에 관심이 커지고 있다. 이 분야에 뛰어들고 있는 대표적인 스타트업 중 한 곳이 씨앤에이아이(대표 이원섭)이다. 이 회사는 글로벌 선두 합성데이터 기업을 목표로 2019년 10월에 설립됐으며, 주요 사업분야로 합성데이터 생성 플랫폼 ‘씨앤플로우(CN Flow)’와 AI 휴먼을 제공하고 있다.
회사 측에 따르면 씨앤플로우는 비전문가들도 쉽게 비전 분야 합성데이터를 생성할 수 있는 원스톱 합성데이터 생성 플랫폼이다. 콘텐츠, 국방, 리테일 분야 등 다양한 산업군에 서비스형 플랫폼(PaaS)형태로 사용해 AI모델 학습에 사용하거나, 콘텐츠 생성 플랫폼으로도 활용될 수 있다.
씨앤에이아이는 의료, 제조 등 분야에서 이미 프로젝트 형태로 완료한 바 있으며, 상반기 중 합성데이터를 만들어낼 수 있는 플랫폼을 기업 맞춤형으로 제공할 예정이다. 즉 기업이 스스로 합성데이터를 만들어낼 수 있는 플랫폼을 공급하는 것이다.
씨앤에이아이의 AI 휴먼은 합성데이터를 활용해 생성한다. 이미 은행/공공기관/프로 스포츠 등 다양한 산업의 고객을 대상으로 AI휴먼 제품을 납품하거나, 또는 AI휴먼 생성 플랫폼인 씨엔 스튜디오(CN. Studio)를 SaaS형태로 공급했다.
씨앤에이아이 측은 가장 큰 장점으로 내부 구성원들의 기술력을 꼽고 있다. 팀장급 이상 경영진은 삼성전자, SK 등 국내 최고 기업에서 다양한 경력을 쌓았다. 또한 스탠포드 컴퓨터 공학 박사를 포함한 국내 유수 대학 출신의 개발자들이 리서치와 서비스 개발에 열중하고 있다. 이에 국내 합성데이터 기업 중에서 가장 많은 특허를 보유하고, 연구성과 역시 저명한 학회에 등록될 정도로 전문성을 인정받고 있다는 것이 회사 측의 설명이다.
실제 외부 평가도 좋다. 지난해 6월에는 중소벤처기업부 장관상과 과학기술정보통신부 장관상을 수상했다. 10월에는 코리아 AI 스타트업 100에 선정되기도 했고 올해 초에는 CES2023에 참가했다.
김보형 씨앤에이아이 CTO는 “씨앤에이아이는 국내 최초 AI 합성데이터 기업으로, 모두가 고성능의 AI를 사용하는 위드(With) AI시대를 선도하겠다”면서 “AI합성데이터 기반의 AI휴먼과 씨앤 플로우 플랫폼을 기반 삼아, AI기반의 이미지/영상 생성 플랫폼을 제공하는 것이 궁극적인 목표”라고 말했다.
한편 김보형 씨앤에이아이 CTO는 19일 ‘챗GPT 등 생성AI를 활용한 서비스 사례 분석 및 전망 세미나’에서 ‘AI를 이용한 합성 이미지 데이터 생성’이라는 주제로 발표한다. 이 행사에서는 씨앤에이아이 뿐만 아니라 업스테이지, 올거나이즈, 스켈터랩스, 튜닙, 뤼튼테크놀로지, 라이언로켓 등 주요 생성 AI 스타트업이 직접 개발한 생성AI 활용서비스 사례를 발표한다. 이 행사에 대한 자세한 정보와 행사 참가는 전자신문 웹사이트(https://conference.etnews.com/conf_info.html?uid=246) 를 통해 확인할 수 있다.
전자신문인터넷 유은정 기자 (judy6956@etnews.com)