DeepSeek은 2023년 4월 24일 V4 대형 언어 모델 출시 직후 토요일에 API 서비스에 대한 상당한 가격 인하를 발표했습니다. 가격은 낮은 입력 캐시 적중 수수료를 이전 수수료의 10분의 1로 인하하고 2023년 5월 5일까지 V4-Pro 모델에 대해 75% 할인을 제공합니다.

V4-Pro의 입력 캐시 적중 가격은 백만 토큰당 0.025위안(약 0.0036달러)으로 떨어졌습니다. 프로모션 기간 동안 표준 가격은 백만 토큰당 입력 3위안, 출력 6위안으로 설정됩니다. OpenRouter 데이터에 따르면 이 가격 전략은 Anthropic, OpenAI 및 Google의 모델이 백만 토큰당 12~25달러 사이의 가격으로 경쟁사보다 훨씬 저렴합니다.

DeepSeek은 미리보기 용량으로 V4-Pro 및 V4-Flash를 출시하여 2022년 12월 V3.2 버전 이후 회사의 첫 번째 중요한 모델 출시를 기록했습니다. V4-Pro는 추론 패스당 1조 6천억 개의 매개변수와 490억 개의 활성 매개변수를 갖추고 있어 현재 사용 가능한 가장 큰 개방형 가중치 모델입니다. V4-Flash는 2,840억 개의 매개변수를 갖춘 더 작은 구성을 제공합니다.

최근 인하 이전에도 V4-Pro의 표준 가격은 백만 토큰당 입력의 경우 1.74달러, 출력의 경우 3.48달러였으며 이는 OpenAI의 GPT-5.5 Pro 가격보다 약 98% 낮았습니다. 최신 할인으로 이러한 경쟁 우위가 더욱 확대되었습니다.

  구글, 개인정보(Personal Intelligence)를 전 세계로 확장

AI 부문의 컴퓨팅 전력 비용이 상승하는 가운데 DeepSeek의 전략은 업계 내 가격 인하의 광범위한 추세와 일치합니다. Gelonghui의 보고서에 따르면 회사는 “AI 가격 인하”라는 개념을 완전히 수용했습니다.

특히 V4는 Nvidia 칩 대신 Huawei Ascend 하드웨어에서 작동하므로 관찰자들은 AI 시스템의 국내 채택을 향상시킬 수 있다고 제안합니다. Counterpoint Research의 수석 AI 분석가인 Wei Sun은 이번 개발을 통해 Nvidia에만 의존하지 않고도 AI 시스템을 배포할 수 있으며 잠재적으로 국내 및 글로벌 AI 발전을 가속화할 수 있다고 밝혔습니다.

V4-Pro는 100만 개의 토큰 컨텍스트 창에 이전 버전인 V3.2의 컴퓨팅 성능의 27%만 필요로 하여 상당한 효율성을 보여줍니다. DeepSeek은 이러한 발전에도 불구하고 회사의 기술 문서에 명시된 바와 같이 V4가 GPT-5.4 및 Gemini 3.1 Pro와 같은 주요 모델보다 약 3~6개월 정도 성능이 뒤처져 있음을 인정합니다.

<시간 />

추천 이미지 크레딧