[에듀플러스]고려대, 정치권 '성인지 감수성' AI로 평가한다… 국회 발언 6천 건 분석해 데이터셋 구축

(왼쪽부터) 박선경 고려대 글로벌한국융합학부 교수(제1저자), 송상헌 언어학과 교수, 강우창 정치외교학과 교수,  김태균 한국과학기술원(KAIST) 디지털인문사회과학부 교수(교신저자)(사진=고려대)
(왼쪽부터) 박선경 고려대 글로벌한국융합학부 교수(제1저자), 송상헌 언어학과 교수, 강우창 정치외교학과 교수, 김태균 한국과학기술원(KAIST) 디지털인문사회과학부 교수(교신저자)(사진=고려대)

고려대학교는 박선경 글로벌한국융합학부 교수, 송상헌 언어학과 교수, 강우창 정치외교학과 교수, 김태균 KAIST 디지털인문사회과학부 교수 연구팀이 정치 담론 속 성인지 감수성을 체계적으로 평가할 수 있는 데이터셋 구축과 이를 통해 생성형 인공지능의 성인지 감수성 판단 능력을 검증했다고 23일 밝혔다.

언어학과 정치학을 융합한 이번 연구 성과는 Nature 자매지인 'Scientific Data(IF=6.9)' 온라인에 이달 11일 게재됐다.

최근 챗GPT 등 생성형 인공지능이 정치 담론 분석에 활용되고 있지만, 문화적 맥락에 따라 달라지는 성차별적 표현을 얼마나 정확히 인식할 수 있는지 검증이 충분치 않았다. 특히 한국어 기반 성인지 감수성 평가 자원이 없는 상황에서 이를 점검할 수 있는 기준이 필요하다고 제기됐다.

연구진은 1948년 제헌국회부터 2024년까지 76년간의 국회 회의록 1222건 중 젠더 관련 발화 6024개를 추출하고 각 발화의 성인지 감수성 수준을 평가했다. 이를 토대로 성인지 감수성 수준이 반영된 데이터셋 'KOGENT(Korean GENder-sensitivity Tagged dataset)'를 구축했으며, 여성·남성뿐 아니라 성소수자 관련 표현까지 포함했다.

[에듀플러스]고려대, 정치권 '성인지 감수성' AI로 평가한다… 국회 발언 6천 건 분석해 데이터셋 구축

연구진은 KOGENT를 활용해 GPT-4 계열 언어모델의 성인지 감수성 판단 능력을 분석했다. 그 결과, GPT-4.1 모델은 성인지 감수성 수준이 높은 발언을 90% 이상의 정확도로 분류했다. 특히 데이터셋에서 추출한 고품질 예시를 제공했을 때 성능이 더욱 향상되는 경향을 보였다. 이는 KOGENT 데이터셋이 성인지 감수성 평가를 위한 실증적 기준으로 활용될 수 있음을 보여준다.

송상헌 언어학과 교수는 “이번 연구는 정치학과 언어학이라는 서로 다른 분야가 인공지능을 통해 하나의 주제로 융합된 사례”라며 “향후 인공지능을 활용한 학제 간 연구의 선도적인 사례가 될 것”이라고 강조했다.

박선경 글로벌한국융합학부 교수는 “기존 연구가 주로 명백한 혐오 표현 탐지에 집중했다면, 이번 연구는 겉으로는 중립적으로 보이지만 맥락상 편견을 담은 표현까지 분석 대상으로 삼았다”라고 말했다.

이어 “국회의원 공식 발언을 통해 공적 언어 환경에서 나타나는 성인지 감수성의 양상을 살폈다는 점에서도 의미가 있다”라고 설명했다.

이번 연구는 교육부, 한국연구재단, 고려대 언어정보연구소의 지원을 받아 수행됐으며, 구축한 데이터셋과 코드는 피그쉐어(Figshare)와 깃허브(GitHub)를 통해 공개됐다.

권미현 기자 mhkwon@etnews.com