ICT 시사용어
쉽게 배우는 시사상식. ICT 시사용어에서 쉽고 편리하게 만나보실 수 있습니다.
AI 우로보로스[AI Ouroboros]
생성형 AI의 확산으로 인터넷과 데이터 환경에 AI가 만든 텍스트, 이미지, 영상이 급증하면서 AI 모델의 학습 데이터에서 AI 생성물이 유입되고 있다. 인간이 생산한 데이터가 아닌 AI가 만들어낸 결과물을 AI모델이 학습하면 데이터 다양성과 현실성이 훼손될 수 있다는 우려가 나온다. 특히 대규모 언어모델(LLM)이나 이미지 생성 모델 등 생성형 AI 전반에서 문제가 될 수 있다. 검색·추천, 코드 생성 등 AI가 제공하는 디지털 서비스 품질에도 영향을 준다.
AI 우로보로스 현상이 심화되면 '모델 붕괴'(Model Collapse)로 이어질 수 있다. 모델 붕괴는 AI가 생성한 콘텐츠를 기반으로 훈련한 생성형AI 모델의 정확도와 창의성, 신뢰성 등이 저하되는 것을 의미한다. 오류, 편향, 허위 정보가 누적·증폭될 가능성도 지적된다.
또, 반복적인 학습 과정에서 저작권을 보호받는 콘텐츠의 출처와 계보가 모호해져 원본의 흔적을 지우는 '저작권 세탁' 문제도 발생할 수 있다. 의도적으로, 혹은 개발자들 자신도 모르는 사이에 오염된 데이터로 저작권을 침해할 가능성이 생기는 것이다.
AI 우로보로스 현상을 방지하기 위해 산업계와 학계에서는 인간이 생성한 데이터의 비중을 유지하고 고품질의 데이터를 선별하며 AI가 생성한 결과물을 식별·필터링하는 방법을 고안하고 있다.