[ET단상]지식재산 데이터와 인공지능 활용

기업에서 수년간 연구개발(R&D)한 기술이 이미 누군가의 특허라면 기업의 노력은 특허 분쟁에 휘말려 한순간에 물거품이 될 수도 있다.

글로벌 기술 트렌드를 읽고 경쟁사의 기술 개발 동향을 분석하는 것은 기업이 시장에서 살아남기 위한 필수불가결한 요소다.

이를 위해서는 특허 데이터 분석이 반드시 필요하다. 문제는 특허 데이터가 매년 전 세계에서 약 300만건 쏟아져 나온다는 것이다.

특허 데이터를 분석하는 기존 방식은 인해전술에 비교할 만했다. 키워드를 통해 검색된 수천 또는 수만 건의 결과로부터 불필요한 데이터를 제거하고 원하는 기준으로 특허를 분류하기 위해서는 한 건, 한 건 살펴보는 방법밖에 없었다. 그만큼 많은 시간과 비용을 투입해야 했다.

최근 인공지능(AI) 기술이 발전하면서 다양한 특허 업무 영역에서 AI를 활용하려는 시도가 이뤄지고 있다. 활용도가 가장 높은 영역은 선행기술 조사다. 복잡한 키워드 검색 식을 입력하지 않아도 기술 내용과 가장 유사한 특허 문헌을 찾을 수 있다. 이는 특허를 출원하는 발명자나 특허의 등록 또는 무효 여부를 다루는 심사관 및 변리사에게 유효하게 활용된다.

AI 기술이 적용된 무효 자료 조사는 현재 전문가 인력이 수행하는 방식에 비해 생산성이 3배 이상 높아지고, 10만건당 비용도 5분의 1 수준으로 절약할 수 있다는 보고도 있다.

특허 동향 조사에도 AI가 활용될 수 있다. 국가별, 주요 기업별 특허 동향을 분석하기 위해서는 세부 기술별로 관련 특허를 분류해야 한다. 이때 관련 없는 특허를 제거하는 노이즈 필터나 시장의 성숙도 및 유망 기술 분석에 AI를 적용할 수 있다.

지식재산(IP) 서비스 전문 기업은 데이터 가공을 위한 정보의 추출 및 정비에 AI를 활용할 수 있다. 특허데이터에는 출원일, 출원인, 인용, 패밀리, 발명의 내용 등 다양한 정형·비정형 정보가 포함돼 있다.

AI 학습을 통해 규칙에 어긋난 데이터를 찾아내 정비에 활용할 수 있고, 비정형 데이터에서 서비스에 필요한 특정 데이터만 추출해서 서비스에 활용할 수 있다. 또 다양한 언어로 표현된 특허문서 번역에도 AI 기반의 인공신경망 기계번역(NMT)이 확대되고 있는 추세다.

그렇지만 AI를 본격 활용하기 위해서는 우선 특허문서에 특화된 언어처리 기술에 대한 연구가 필요하다. 특허는 기술 용어 및 서술 방식이 전문 영역인 데다 특수하기 때문에 아무리 딥러닝 기반의 자연어 처리 기법을 활용하더라도 문제가 발생한다. 새로운 기술 용어는 낮은 빈도로 사용되기 때문에 AI가 적합하게 학습할 수 없는 문제도 해결해야 한다.

또 고품질의 IP 서비스를 위해서는 특허 데이터뿐만 아니라 특허소송, 기술거래, IP 가치평가 등 다양한 데이터가 필요하다. 이 같은 다양한 데이터를 IP 서비스 유형·목적을 고려해 AI 학습데이터로 가공해야 한다. IP 데이터 공유·활용 촉진을 위해서는 공공과 민간 협업을 통한 플랫폼 구축을 검토할 필요가 있다. AI를 활용해 IP 데이터를 분석할 수 있는 전문 인력도 양성해야 한다.

당장 AI가 심사관, 변리사 등 IP 전문가를 대체할 수는 없다. 특허 분류, 유사 특허 검색은 기술 전문성 또는 특허 심사 기준에 대한 지식과 경험이 필요하기 때문이다. 그러나 AI는 IP 전문가가 업무를 수행할 때 훌륭한 조력자 역할을 할 수 있다.
코로나19 이후 글로벌 산업 구조는 전면 개편될 것이다. 우리 기업이 경쟁에서 살아남고 세계 시장을 선도하는 퍼스트 무버가 되기 위해서는 방대한 IP 데이터 분석을 통한 혁신 전략을 수립해야 한다. 이를 위해 다양한 IP 데이터 구축과 함께 AI가 전문가의 지식과 경험을 습득할 수 있도록 당분간 모든 노력을 쏟아부어야 할 것이다.

박은영 국가지식재산위원회 창출전문위원(주식회사 윕스 상무이사)
박은영 국가지식재산위원회 창출전문위원(주식회사 윕스 상무이사)

박은영 국가지식재산위원회 창출전문위원(윕스 상무이사) parkey@wips.co.kr