OpenAI는 2025년 12월 GPT-Image-1.5 출시에 이어 AI 이미지 생성 기능을 대폭 강화한 ChatGPT Images 2.0을 공식 출시했습니다. LM Arena AI에서 테스트 중인 새 모델은 긴 텍스트 블록, 사실적인 사용자 인터페이스로 상세한 이미지를 생성할 수 있으며 Sam Altman을 포함한 실제 인물도 재현할 수 있습니다.

이번 업데이트는 OpenAI가 시각 미디어에 접근하는 방식이 크게 발전했음을 나타냅니다. ChatGPT 이미지 2.0은 평면도, 이미지 그리드, 캐릭터 모델을 생성하고 사용자가 업로드한 이미지에 기능을 적용할 수 있습니다. 이는 이미지를 단순한 장식으로 보는 것에서 언어 형태로 이해하는 것으로의 전환을 나타냅니다.

OpenAI는 새 모델에 대한 벤치마크 비교를 제공하지 않았지만 특히 이미지에 텍스트 통합 기능을 갖춘 Google이 최근 출시한 Nano Banana 2 모델과 비교할 때 성능이 “최첨단” 기능과 일치한다고 주장합니다. 보고서에 따르면 ChatGPT Images 2.0은 충실도와 사용자 인터페이스 재현 측면에서 더 나은 성능을 발휘할 수 있습니다.

OpenAI는 안전에 대한 노력의 일환으로 AI 생성 이미지에 메타데이터 태깅을 통합하여 정치적 맥락에서 AI 기술의 오용 가능성에 대한 우려가 커지고 있는 상황에 대응할 것입니다. 최근 브리핑에서 OpenAI의 제품 책임자인 Adele Li는 고급 안전 프로토콜을 통해 정치적 간섭을 방지하기 위한 회사의 사전 조치를 강조했습니다.

  Anthropic은 Claude 모델을 구동하기 위한 맞춤형 AI 칩 설계를 탐구합니다.

업데이트된 모델에는 “O 시리즈” 추론 기능이 통합되어 있어 이미지를 생성하기 전에 레이아웃을 연구하고 고려할 수 있어 일관된 시각적 스토리텔링 자산을 생성하는 능력이 향상됩니다. 시연을 통해 모델이 복잡한 문서를 합성하고 지도를 정확하게 재현할 수 있음을 보여주어 이전 반복에 비해 기능이 크게 향상되었습니다.

Images 2.0 기능은 고품질 타이포그래피와 다국어 텍스트 생성을 지원하도록 구성되어 AI 생성 이미지의 오랜 문제를 해결합니다. 이 반복을 통해 비라틴어 스크립트 전반에 걸쳐 일관된 텍스트를 생성하여 전 세계 사용자에게 향상된 접근성을 제공할 수 있습니다.

OpenAI는 출시를 위한 명확한 계층형 액세스 시스템을 설명했습니다. 무료 사용자는 기본 모델에 대한 표준 액세스 권한을 갖고, Plus 및 Pro 사용자는 AI 지원 추론 및 단일 프롬프트에서 연속성을 유지하는 여러 이미지 생성 기능을 포함한 고급 기능에 액세스할 수 있습니다.

API 개발자를 위한 가격 구조는 이전 모델에 비해 감소했습니다. 이미지 생성 비용은 입력당 $8.00, 출력당 $30.00이고, 텍스트 생성 비용은 입력당 $5.00, 출력당 $10.00입니다. ChatGPT Images 2.0으로의 전환은 OpenAI의 접근 방식이 기업 채택에 맞춰져 있어 더 높은 생산성을 촉진할 수 있는 보다 복잡한 창의적 작업을 허용한다는 것을 나타냅니다.

  Gemini 사이드바가 아시아 태평양 브라우저 전반에 걸쳐 출시됩니다.

경쟁이 심화되고 기술이 발전함에 따라 OpenAI는 최첨단 AI 도구를 제공하는 동시에 사용자 안전과 만족도를 높이는 데 중점을 두고 있습니다. ChatGPT Images 2.0의 기능이 발전함에 따라 회사는 AI 예술 창작의 의도 격차를 해소하여 사용자 요구와 윤리 기준을 모두 충족시키는 것을 목표로 합니다.

<시간 />

추천 이미지 크레딧