오픈AI, 실무용 이미지 생성 '챗GPT 이미지 2.0' 공개

챗GPT 생성형 AI 이미지. ⓒ오픈AI
챗GPT 생성형 AI 이미지. ⓒ오픈AI

오픈AI가 디자인 시안까지 만드는 실무에 활용 가능한 인공지능(AI) 이미지 생성 모델 '챗GPT 이미지 2.0'을 21일(현지시간) 공개했다.

작은 텍스트와 복잡한 레이아웃까지 정밀하게 구현할 수 있는 모델이다. 영어뿐 아니라 한국어 등 다국어 텍스트 구현 정확도가 대폭 개선됐다. <본지 4월 21일자 3면 참조>

구글이 독주해온 AI 이미지 생성 시장 판도 변화를 이끌어낼지 관심이 쏠린다. 오픈AI 이미지 생성 모델은 출시 이후 줄곧 '제미나이·나노바나나' 등 구글 서비스와 비교됐다. 구글 AI가 사진 같은 수준, 업무 프레젠테이션 자료 수준으로 이미지를 생성해주는 반면, 오픈AI의 이미지 생성 정확도가 떨어졌다.

이번 업데이트로 업무용 시장에서도 챗GPT 이미지 채택률이 늘어날 것이라는 게 오픈AI측 기대다. 2.0 모델은 사용자의 세부 지시를 정밀하게 반영, 기존 대비 보다 활용도 높은 결과를 제공한다.

이미지 내 사물 위치와 관계를 정교하게 구성하고 작은 글자, 아이콘, 사용자환경(UI) 요소, 촘촘한 레이아웃, 스타일 제약 등 고난도 영역에서 향상된 결과를 제공한다. 최대 3대 1~1대3의 화면 비율을 지원하고 사진·만화·영화 등 여러 스타일을 정밀하게 재현, 실제 제작 환경에서 활용범위를 넓혔다.

다국어 성능도 강화했다. 챗GPT 이미지 2.0은 한국어와 일본어, 중국어, 힌디어, 벵골어 등 다양한 언어에서 텍스트 렌더링(이미지 텍스트 출력) 품질을 개선했다. 최대 10개 이미지를 한 번에 생성할 수 있다. 포스터, 설명 자료, 다이어그램, 만화 등에서 언어를 읽히는 문자로 자연스럽게 구현할 수 있다.

생성형 AI 이미지. 챗GPT 공공기관 AI 학습용 데이터 전수조사 관련 이미지 생성 업데이트 전(좌상단)·후 비교. 동일한 프롬프트에도 완성도가 크게 달라졌다.
생성형 AI 이미지. 챗GPT 공공기관 AI 학습용 데이터 전수조사 관련 이미지 생성 업데이트 전(좌상단)·후 비교. 동일한 프롬프트에도 완성도가 크게 달라졌다.

전자신문이 챗GPT 플러스 서비스 기준으로 확인한 결과, 동일한 프롬프트로 이미지 생성 명령 시 1.5 버전 대비 2.0 버전 결과물의 정확도가 대폭 개선됐다. 한글 맞춤법의 정확성은 물론, 레이아웃과 구성 등이 깔끔해졌다. 특히 프롬프트를 반복할수록 보다 정확하고 만족스러운 결과물을 얻을 수 있다.

오픈AI는 “챗GPT 이미지 2.0을 기반으로 기획서, 마케팅 소재, 교육 자료, 인포그래픽, 소셜 콘텐츠 등을 바로 활용 가능한 결과물 형태로 생성할 수 있다”고 강조했다.

2.0은 오픈AI 최초 싱킹(사고) 기반 이미지 모델이다. 챗GPT에서 싱킹 또는 프로 모델을 선택하면 웹 검색을 통한 정보 탐색, 하나의 프롬프트 기반 복수 이미지 생성, 결과 점검 기능을 지원한다. 아이디어를 단순 생성하는 데서 나아가 검증된 결과물로 구체화하는 과정으로 연결할 수 있다.

챗GPT 이미지 2.0은 챗GPT와 코덱스에서 사용할 수 있으며 챗GPT 이미지 싱킹 기반 고급 출력 기능은 챗GPT 플러스 이상 사용자에 제공된다. 동일한 기반 모델 'GPT-이미지-2'는 API로 사용할 수 있다.

AI 이미지 생성 시장 내 경쟁은 심화될 전망이다. 구글뿐 아니라 감마·캔바 등 AI 디자인 특화 서비스도 지속 업데이트되고 있다. '포토샵' 등 이미지 소프트웨어 강자 어도비 역시 일관된 브랜드 정체성을 유지할 수 있는 마케팅용 AI 에이전트를 공개하며 생성형 AI 서비스와 정면승부를 예고했다.

박종진 기자 truth@etnews.com