DeepSeek은 중국 국내 생산 칩에 최적화된 향상된 성능을 주장하는 새로운 AI 모델인 DeepSeek V4를 출시했습니다. 이 모델은 백만 단어의 매우 긴 컨텍스트를 특징으로 하며 에이전트 기능, 세계 지식 및 추론 성능을 향상시킵니다.
DeepSeek V4는 DeepSeek V4-Pro와 DeepSeek V4-Flash의 두 가지 버전으로 제공됩니다. 회사는 후자가 더 효율적이고 경제적인 옵션이라고 설명합니다. DeepSeek에 따르면 V4-Pro는 세계 지식 벤치마크에서 다른 오픈 소스 모델보다 훨씬 뛰어난 성능을 발휘하며 Google의 비공개 소스 모델인 Gemini-Pro-3.1보다 약간 더 뛰어납니다.
V4-Pro 변형에는 오픈 소스 모델의 지식 기능을 향상시켜 해당 분야에서 최고의 경쟁자로 자리매김하도록 설계된 “최대 추론 노력 모드”가 포함되어 있습니다. DeepSeek은 이전에 OpenAI의 ChatGPT와 같은 AI 시스템에 더 낮은 개발 비용으로 도전한 이전 모델인 R1을 통해 주식 시장에서 1조 달러의 매도세를 일으켰습니다.
작년 R1 릴리스로 인해 주요 기술 회사에 상당한 손실이 발생했으며 Nvidia는 하루에 5000억 달러 이상의 손실을 입었습니다. 이번 출시는 또한 중국 AI 회사가 기존 미국 거대 기술 기업을 상대로 한 최초의 대규모 경쟁이었습니다. DeepSeek의 출시는 미국의 중국에 대한 반도체 수출 제한 가운데 이루어졌으며, 특히 AI 개발에 필수적인 고급 GPU에 영향을 미칩니다.
DeepSeek V4 훈련에 사용되는 칩 시스템은 공개되지 않았지만 회사는 Nvidia와 Huawei 칩을 모두 지원한다고 밝혔습니다. DeepSeek V4는 AI 모델의 기본 데이터 단위인 최대 384,000개의 토큰을 처리할 수 있습니다. 이는 128,000개의 토큰만 관리했던 이전 V3에 비해 상당한 개선이 이루어진 것입니다.
업그레이드를 통해 다중 문서 추론이 가능해 AI가 전체 책과 전체 코드 데이터베이스를 이해할 수 있습니다. 회사는 이 기능이 “계산 효율성의 극적인 도약”을 나타내며 백만 길이의 컨텍스트를 갖춘 대규모 언어 모델의 새로운 시대를 열었다고 주장합니다.
DeepSeek V4-Pro는 Google의 Gemini-3.1-Pro보다 성능이 뛰어나지만 여전히 Anthropic의 Claude Opus 4.6 모델보다 뒤떨어집니다. DeepSeek은 다양한 작업과 시나리오에서 모델의 지능, 견고성 및 유용성을 더욱 향상시키는 것을 목표로 합니다.
<시간 />








