Anthropic은 Claude Sonnet 4와 유사한 코딩 성능을 갖춘 대기 시간 최적화된 “소형” 모델인 Claude Haiku 4.5를 출시했습니다. 회사에서는 Haiku 4.5가 Sonnet 4보다 1/3의 비용으로 2배 이상 빠르게 실행된다고 보고했습니다. Anthropic의 API와 Amazon Bedrock 및 Google Cloud Vertex AI의 파트너 카탈로그를 통해 즉시 사용할 수 있습니다. Haiku 4.5의 가격은 입력 토큰 백만 개당 1달러, 출력 토큰 백만 개당 5달러로 설정됩니다. 프롬프트 캐싱의 경우 나열된 요금은 쓰기 토큰 백만 개당 1.25달러, 읽기 토큰 백만 개당 0.10달러입니다. Anthropic은 실시간 보조자, 고객 지원 자동화 및 쌍 프로그래밍을 포함하여 짧은 대기 시간 예산과 높은 처리량을 갖춘 워크로드에 대해 Haiku 4.5를 포지셔닝합니다. 회사는 비용에 민감한 대화형 워크로드에서 Haiku 3.5 및 Sonnet 4를 즉시 대체할 수 있는 제품으로 이를 제안합니다. Chrome용 Claude와 같은 제품에서 볼 수 있듯이 GUI 및 브라우저 조작과 관련된 “컴퓨터 사용” 작업에서 Sonnet 4를 능가하는 것으로 알려졌습니다. 또한 다중 에이전트 프로젝트 및 신속한 프로토타이핑을 위해 Claude Code의 응답성을 향상시킵니다. Anthropic의 모델 라인업 내에서 Sonnet 4.5는 “세계 최고의 코딩 모델”이라고 설명하는 회사의 선두 모델로 남아 있습니다. Haiku 4.5는 더 큰 비용 효율성으로 최전선에 가까운 성능을 제공할 수 있는 위치에 있습니다. Anthropic은 병렬 실행을 관리하는 Haiku 4.5 작업자 풀을 통해 Sonnet 4.5가 다단계 계획을 처리하는 오케스트레이션 패턴을 권장합니다. 개발자는 식별자를 사용하여 Anthropic API의 모델에 액세스할 수 있습니다. claude-haiku-4-5. Anthropic은 출시 당시 Amazon Bedrock 및 Google Cloud Vertex AI에서 가용성을 확인했지만 회사는 특정 모델 카탈로그 ID 및 지역 적용 범위가 시간이 지남에 따라 변경될 수 있음을 지적합니다. Anthropic은 모델의 기능을 입증하기 위해 벤치마크 결과를 제공했습니다. SWE-bench Verified에서 Haiku 4.5는 bash 및 파일 편집 도구가 포함된 간단한 스캐폴드를 사용하여 73.3%의 점수를 달성했습니다. 이 결과는 128,000개의 사고 예산과 테스트 시간 계산 없이 50회 이상의 시도를 평균한 것입니다. 또한 회사는 11번의 실행에 걸쳐 Terminus-2 에이전트로 테스트된 Terminal-Bench와 4번의 실행에 걸쳐 최대 100단계로 테스트된 OSWorld 검증의 결과를 공유했습니다. AIME 및 MMMLU의 성능도 기본 샘플링 및 128K 사고 예산을 사용하여 측정되었습니다. 회사는 이러한 결과가 Sonnet 4와의 코딩 패리티와 특정 테스트 스캐폴드 하에서 컴퓨터 사용 작업의 성능 향상을 보여준다고 밝혔습니다. 성능을 일반화하기 전에 사용자에게 자체 오케스트레이션 및 도구 스택으로 테스트를 복제하도록 조언합니다. 이 모델은 ASL-2 라이센스로 출시되었습니다. 내부 테스트에서 Anthropic은 Haiku 4.5가 Sonnet 4.5 및 Opus 4.1보다 정렬 불량 비율이 더 낮다고 보고했습니다.

  Diablo 4 Paragon 보드 가이드: 무엇을 알아야 합니까?

Source: Anthropic, Claude Haiku 4.5 모델 출시