OpenAi는 회사가 “가장 유능한”것으로 묘사 한 새로운 AI 모델 인 O3-Pro를 출시했습니다. O3-PRO 모델은 OpenAI의 O3 추론 모델의 향상된 버전으로 올해 초에 소개되었습니다.
O3 및 O3-Pro와 같은 추론 모델은 물리, 수학 및 프로그래밍과 같은 복잡한 도메인의 성능을 향상시키기위한 단계별 문제를 순차적으로 처리하도록 설계되었습니다.
화요일부터 O3-PRO는 ChatGpt Pro 및 팀 계획 사용자가 이용할 수 있으며 이전 O1-PRO 모델을 대체합니다. OpenAi는 Enterprise 및 EDU 사용자가 다음 주에 O3-PRO에 액세스 할 것이라고 밝혔다.
ChatGpt 내에서의 가용성 외에도 O3-PRO 모델은 이제 OpenAI의 개발자 API에서 생중계됩니다. API의 가격은 백만 달러당 $ 20로, 입력 토큰 당 $ 80로 설정됩니다. OpenAi는 백만 입력 토큰이 750,000 단어와 거의 같다고 명확히합니다.
Openai는 Changelog에서 다음과 같이 말하면서 모델의 성능 향상을 강조했습니다.“전문가 평가에서 검토 자들은 모든 테스트 된 카테고리, 특히 과학, 교육, 프로그래밍, 비즈니스 및 글쓰기 도움과 같은 주요 영역에서 O3보다 O3-Pro를 지속적으로 선호합니다.” 이 회사는 또한 검토자가 O3-Pro를“명확성, 포괄적 성, 교육 추종 및 정확성”으로 더 높은 평가했다고 언급했습니다.
O3-PRO는 다양한 도구와 통합되어 웹 브라우징, 파일 분석, 시각적 입력 이해, 파이썬 사용 및 메모리 기능을 통해 응답을 개인화하는 기능과 같은 기능을 가능하게합니다. 그러나 OpenAI는 단점을 인정했습니다. O3-PRO 응답은 일반적으로 O1-PRO에 비해 생성하는 데 시간이 오래 걸립니다.
새 모델에는 릴리스시 특정 제한 사항이 있습니다. 진행중인 기술 문제로 인해 Chatgpt에서 O3-Pro와의 임시 채팅 세션이 현재 비활성화되어 있습니다. O3-PRO는 이미지 생성을 지원하지 않으며 OpenAI의 AI 구동 작업 공간 기능 인 Canvas와 통합되지 않습니다.
이러한 중간 한계에도 불구하고 OpenAI는 표준 AI 벤치 마크에서 강력한 성능을 나타내는 내부 테스트 결과를 제시했습니다. 회사의 데이터에 따르면, O3-Pro는 AIME 2024 수학 기술 테스트에서 Google의 Gemini 2.5 Pro보다 더 잘 수행했습니다. 또한 O3-Pro는 과학 박사 학위 수준의 벤치 마크 테스트 지식 인 GPQA 다이아몬드에서 Anthropic의 최근 출시 된 Claude 4 Opus를 능가했습니다.
OpenAi는 O3-PRO가 O3과 동일한 핵심 모델을 공유하기 때문에 O3 시스템 카드에서 포괄적 인 안전성 세부 사항을 찾을 수 있다고 지정했습니다.
Source: OpenAi는 O3-Pro 추론 AI 모델을 시작합니다







