
오픈AI가 디자인 시안까지 만드는 실무에 활용 가능한 인공지능(AI) 이미지 생성 모델 '챗GPT 이미지 2.0'을 21일(현지시간) 공개했다.
작은 텍스트와 복잡한 레이아웃까지 정밀하게 구현할 수 있는 모델이다. 영어뿐 아니라 한국어 등 다국어 텍스트 구현 정확도가 대폭 개선됐다. <본지 4월 21일자 3면 참조>
구글이 독주해온 AI 이미지 생성 시장 판도 변화를 이끌어낼지 관심이 쏠린다. 오픈AI 이미지 생성 모델은 출시 이후 줄곧 '제미나이·나노바나나' 등 구글 서비스와 비교됐다. 구글 AI가 사진 같은 수준, 업무 프레젠테이션 자료 수준으로 이미지를 생성해주는 반면, 오픈AI의 이미지 생성 정확도가 떨어졌다.
이번 업데이트로 업무용 시장에서도 챗GPT 이미지 채택률이 늘어날 것이라는 게 오픈AI측 기대다. 2.0 모델은 사용자의 세부 지시를 정밀하게 반영, 기존 대비 보다 활용도 높은 결과를 제공한다.
이미지 내 사물 위치와 관계를 정교하게 구성하고 작은 글자, 아이콘, 사용자환경(UI) 요소, 촘촘한 레이아웃, 스타일 제약 등 고난도 영역에서 향상된 결과를 제공한다. 최대 3대 1~1대3의 화면 비율을 지원하고 사진·만화·영화 등 여러 스타일을 정밀하게 재현, 실제 제작 환경에서 활용범위를 넓혔다.
다국어 성능도 강화했다. 챗GPT 이미지 2.0은 한국어와 일본어, 중국어, 힌디어, 벵골어 등 다양한 언어에서 텍스트 렌더링(이미지 텍스트 출력) 품질을 개선했다. 최대 10개 이미지를 한 번에 생성할 수 있다. 포스터, 설명 자료, 다이어그램, 만화 등에서 언어를 읽히는 문자로 자연스럽게 구현할 수 있다.

전자신문이 챗GPT 플러스 서비스 기준으로 확인한 결과, 동일한 프롬프트로 이미지 생성 명령 시 1.5 버전 대비 2.0 버전 결과물의 정확도가 대폭 개선됐다. 한글 맞춤법의 정확성은 물론, 레이아웃과 구성 등이 깔끔해졌다. 특히 프롬프트를 반복할수록 보다 정확하고 만족스러운 결과물을 얻을 수 있다.
오픈AI는 “챗GPT 이미지 2.0을 기반으로 기획서, 마케팅 소재, 교육 자료, 인포그래픽, 소셜 콘텐츠 등을 바로 활용 가능한 결과물 형태로 생성할 수 있다”고 강조했다.
2.0은 오픈AI 최초 싱킹(사고) 기반 이미지 모델이다. 챗GPT에서 싱킹 또는 프로 모델을 선택하면 웹 검색을 통한 정보 탐색, 하나의 프롬프트 기반 복수 이미지 생성, 결과 점검 기능을 지원한다. 아이디어를 단순 생성하는 데서 나아가 검증된 결과물로 구체화하는 과정으로 연결할 수 있다.
챗GPT 이미지 2.0은 챗GPT와 코덱스에서 사용할 수 있으며 챗GPT 이미지 싱킹 기반 고급 출력 기능은 챗GPT 플러스 이상 사용자에 제공된다. 동일한 기반 모델 'GPT-이미지-2'는 API로 사용할 수 있다.
AI 이미지 생성 시장 내 경쟁은 심화될 전망이다. 구글뿐 아니라 감마·캔바 등 AI 디자인 특화 서비스도 지속 업데이트되고 있다. '포토샵' 등 이미지 소프트웨어 강자 어도비 역시 일관된 브랜드 정체성을 유지할 수 있는 마케팅용 AI 에이전트를 공개하며 생성형 AI 서비스와 정면승부를 예고했다.
박종진 기자 truth@etnews.com