특허청, AI 학습용 지식재산 데이터 7종 무료 개방

특허청, AI 학습용 지식재산 데이터 7종 무료 개방

특허청이 정보서비스 산업 활성화를 위해 인공지능(AI) 학습에 활용 가능한 지식재산 데이터 7종을 특허정보활용서비스(KIPRISplus)를 통해 무료 개방한다.

특허정보활용서비스는 특허청이 운영하는 대표 지식재산 분야 공공데이터 개방 플랫폼이다.

국내는 물론 미국, 유럽, 일본 등 총 13개국에서 발간된 지식재산권 관련 공보와 특허 행정정보 등 총 133종의 지식재산 데이터를 기업과 연구기관, 대학교 등 다양한 수요자들이 자유롭게 활용할 수 있도록 지원한다.

이번에 개방하는 데이터는 2023년 AI기반 특허행정 혁신 사업 추진 과정에서 구축된 것으로 국내 특허·실용신안 공개공보, 미국 특허공보, 의견제출·거절결정서, 특허 패밀리 한영 기계번역, 국제특허분류(CPC), 특허상담 기계독해, 특허고객 상담사례집 등이다.

최근 많은 기업이 AI 성능 향상을 위해 다양한 데이터를 학습시키고 있으며, 이 과정에서 특허 데이터에 대한 수요도 증가하고 있다.

그러나 특허 분야는 복잡한 구조와 전문용어 특성으로 AI 학습에 적합한 데이터를 분석·구축하는 데 막대한 시간과 비용이 소요돼 관련 기업은 양질의 학습데이터를 확보하는 데 어려움을 겪고 있다.

특허청, AI 학습용 지식재산 데이터 7종 무료 개방

이에 특허청은 민간 학습데이터 구축 부담을 경감하고, AI를 활용한 정보서비스 개발을 지원하기 위해 지식재산 데이터를 가공한 고품질 학습데이터를 전면 개방했다.

학습데이터 7종은 특허청 행정업무 및 민원 처리 과정에서 생성된 특허정보를 AI 기술 학습에 적합하도록 가공했다.

관련 기업과 연구기관은 특허문헌 분석서비스, AI 챗봇 등 다양한 AI 기술 개발에 바로 활용할 수 있을 것으로 기대된다.

최일승 특허청 산업재산정보국장 직무대리는 “데이터 개방은 지식재산 정보서비스 산업 고도화에 실질적인 밑거름이 될 것”이라며 “앞으로도 다양한 형태의 특허데이터를 지속적으로 구축·개방해 지식재산 정보 생태계를 더욱 활성화해 나가겠다”고 말했다.

양승민 기자 sm104y@etnews.com