[주니어전자]오픈AI, 똑똑해진 이미지 생성도구 'GPT-이미지 1.5' 공개…지브리풍 넘어 인포그래픽까지

오픈AI가 더 똑똑해진 이미지 생성 도구 'GPT-이미지 1.5' 공개했어요. 일본 애니메이션 제작사 '스튜디오 지브리' 스타일 이미지를 만들 수 있어 큰 인기를 끌었던 오픈AI의 이미지 생성 도구가 새롭게 업그레이드됐거죠.

챗GPT를 만든 회사인 오픈AI는 인공지능(AI) 이미지 생성·편집 도구의 새 버전인 'GPT-이미지 1.5'를 16일(현지시간) 공식 출시했다고 밝혔어요.

이번 출시는 구글이 비슷한 기능의 이미지 생성 도구인 '나노바나나 프로'를 공개한 지 불과 26일 만에 이뤄진 것이어서, 글로벌 AI 기업들 사이의 경쟁이 더욱 치열해지고 있음을 보여줘요.

기존 이미지도 더 정교하게 바꿀 수 있어요

GPT-이미지 1.5의 가장 큰 특징은 이미 만들어진 이미지를 아주 정밀하게 편집할 수 있다는 점이에요. 사용자는 글로 된 명령어(프롬프트)를 입력해 이미지의 세부 요소만 골라 바꿀 수 있어요.

예를 들어, 한 남성이 스케이트보드를 타고 있는 사진을 먼저 만든 뒤, 전체 장면은 그대로 둔 채 옷이나 모자의 색깔만 바꾸는 것이 가능해요. 그림 속에 있는 특정 글씨만 수정하는 것도 쉽게 할 수 있어요.

기존 이미지를 유지한 채 원하는 부분만 바꿀 수 있다.
기존 이미지를 유지한 채 원하는 부분만 바꿀 수 있다.

또 사진에 등장한 인물을 하나의 캐릭터처럼 계속 활용해 포스터나 홍보물 같은 새로운 이미지를 만드는 것도 가능해졌어요.

표·문자 표현도 훨씬 자연스러워졌어요

이전 버전에서는 “가로 6칸, 세로 6줄의 표를 그려달라”는 요청을 해도, 표 일부가 빠지는 등 사용자 의도를 정확히 반영하지 못하는 경우가 있었어요. 하지만 GPT-이미지 1.5에서는 이런 문제가 크게 개선됐다고 오픈AI는 설명했어요.

오픈AI의 인공지능(AI) 이미지 생성·편집 도구 'GPT-이미지 1.5'
오픈AI의 인공지능(AI) 이미지 생성·편집 도구 'GPT-이미지 1.5'

특히 그동안 구글의 나노바나나 프로가 강점으로 평가받았던 '문자 표현 기능'도 한층 강화됐어요. 이제는 이미지 안에 들어가는 글자가 어색하지 않고 또렷하게 표현돼요.

이 덕분에 단순한 그림이나 사진뿐 아니라, 학교 과제나 발표 자료에 활용할 수 있는 인포그래픽도 손쉽게 만들 수 있게 됐어요.

사용자 평가에서 1위 차지했어요

많은 이용자가 직접 이미지를 보고 더 마음에 드는 모델을 고르는 'LM아레나 리더보드'라는 평가 시스템에서, GPT-이미지 1.5는 이날 기존 1위였던 구글의 나노바나나 프로를 제치고 1위에 올랐어요.

이는 실제 사용자들이 체감하는 이미지 품질과 활용도가 높아졌다는 의미로 해석돼요.

오픈AI는 이 도구를 전 세계 모든 사용자가 사용할 수 있도록 적용했어요. 또 챗GPT 화면 왼쪽에 '이미지' 탭을 새로 만들어, 지금까지 생성한 이미지들을 한눈에 모아볼 수 있도록 사용성도 개선했어요.

오픈AI는 어떤 회사인가요?

오픈AI는 챗GPT를 만든 미국의 AI 연구 기업으로, 사람에게 도움이 되는 인공지능을 만드는 것을 목표로 하고 있어요. 텍스트 생성뿐 아니라 이미지, 음성, 영상까지 AI 활용 범위를 넓히며 전 세계적으로 큰 영향을 미치고 있어요.

이번 GPT-이미지 1.5 출시로, 오픈AI는 AI 이미지 생성 분야에서도 선두 자리를 더욱 굳히려는 모습을 보이고 있어요.

최정훈 기자 jhchoi@etnews.com