
한글과컴퓨터(이하 한컴)는 PDF 문서의 접근성 태그를 자동으로 생성·삽입하는 AI 기반 핵심 기능을 오픈소스로 공개했다고 30일 밝혔다.
한컴은 오픈데이터로더(OpenDataLoader) PDF에 해당 기능을 탑재해 배포했다. 이번 공개로 기업과 공공기관은 추가 비용이나 건당 과금 부담 없이 대량의 PDF를 접근성 문서로 전환할 수 있게 됐다.
PDF는 전 세계에서 가장 널리 쓰이는 디지털 문서 형식 가운데 하나지만, 상당수 문서가 접근성 태그 없이 유통되고 있다. 이 경우 스크린 리더(화면 낭독 프로그램)가 문서 구조를 제대로 인식하지 못해 시각장애인을 비롯한 정보 접근 취약 계층이 내용을 파악하기 어렵다.
한컴이 공개한 기능은 문서 구조를 AI가 분석한 뒤, 그 결과를 원본 PDF 파일 안에 직접 기록하는 방식으로 작동한다. AI가 제목, 표, 목록, 이미지 등 구성 요소를 구분하고, 접근성 구조를 반영한 태그 형태로 PDF 내부에 반영한다. 오픈소스 도구 가운데 문서 내용을 추출하는 기능은 많지만, 추출 결과를 실제 PDF 안에 접근성 구조로 완결하여 삽입하는 단계까지 무료로 제공하는 것은 오픈데이터로더 PDF가 유일하다.
오픈데이터로더 PDF는 문서 수량 제한 없이 무제한 활용이 가능하며, 사내(On-premise) 환경에서 처리돼 민감한 문서가 외부 서버로 전송되지 않는다. 파이썬, Node.js, Java 라이브러리와 명령줄 도구도 제공해 기존 업무 흐름과 쉽게 연동할 수 있다.
한컴은 이번 공개를 단순 기능 배포에 그치지 않고, 문서 처리 도구를 넘어 접근성 대응과 규제 준수까지 아우르는 문서 AI 플랫폼 전략의 일환으로 추진한다.
한컴은 2026년 2분기 안에 PDF/UA 국제 표준 준수 수준의 결과물을 출력하는 상용 솔루션도 출시할 계획이다. 핵심 기능은 오픈소스로 폭넓게 제공하고, 감사 대응과 규제 준수가 필요한 기업 고객에게는 전문 솔루션을 공급하는 '오픈 코어' 전략이다. 글로벌 규제에 대응하는 AI 엔진을 무료로 공개하는 한편, 상용 솔루션 출시로 글로벌 사업 확대도 본격화하는 것이다.
정지환 한컴 CTO는 “PDF 접근성 시장은 오랫동안 높은 비용과 복잡한 도입 구조로 운영돼 왔다”며 “한컴은 핵심 기능을 오픈소스로 공개해 누구나 비용 부담 없이 접근성 전환을 시작할 수 있도록 하려 한다”고 말했다.
강성전 기자 castlekang@etnews.com