Z.ai, GLM-5.1 모델 출시, 벤치마크 경쟁사 압도

이전에 Zhipu AI로 알려진 Z.ai는 화요일에 GLM-5.1 모델을 출시했습니다. 이 오픈 소스 플래그십 모델은 에이전트 엔지니어링을 위해 설계되었으며 최대 8시간 동안 단일 코딩 작업을 자동으로 처리하고 연속 루프에서 계획, 실행, 테스트 및 최적화를 수행할 수 있습니다.

GLM-5.1 모델은 SWE-Bench Pro 벤치마크에서 58.4점을 얻어 GPT-5.4, Claude Opus 4.6 및 Gemini 3.1 Pro를 능가했습니다. 이번 릴리스는 2월에 7,440억 매개변수의 Mixture-of-Experts 모델로 도입된 GLM-5의 사후 학습 개선을 따릅니다. 이 모델은 토큰당 약 400억 개의 활성 매개변수를 활용하고 Nvidia 하드웨어 없이 Huawei Ascend 칩에서 전적으로 학습되었습니다.

Z.ai의 문서에 따르면 GLM-5.1은 다중 작업 감독 미세 조정 및 강화 학습 단계와 같은 기술을 통해 코딩 및 에이전트 기능을 향상시킵니다. 이 모델은 전체 “실험-분석-최적화” 루프를 완료하여 8시간 동안 자율 실행을 유지할 수 있습니다. 시연을 통해 8시간 만에 완전한 Linux 데스크톱 시스템을 처음부터 성공적으로 구축하여 655번의 반복을 실행하고 벡터 데이터베이스 쿼리 처리량을 6.9배 늘렸습니다.

GLM-5.1은 200,000개 토큰의 컨텍스트 창을 제공하고 최대 128,000개의 출력 토큰을 지원합니다. 에이전트 코딩 워크플로에 최적화되었으며 Claude Code 및 OpenClaw와 같은 도구와 호환됩니다. 이 모델은 KernelBench 레벨 3 최적화 벤치마크에서 실제 기계 학습 워크로드에 대해 3.6배의 기하 평균 속도 향상을 달성했습니다.

Slack은 재사용 가능한 AI 기술과 더욱 심층적인 Slackbot 자동화를 추가합니다.

GLM-5.1은 모든 GLM 코딩 계획 가입자가 사용할 수 있으며 해당 가중치는 MIT 라이센스에 따라 게시됩니다. 지난 1월 홍콩 증권 거래소에 313억 달러의 가치로 상장된 Z.ai는 백만 입력 토큰당 $1.00, 백만 출력 토큰당 $3.20의 비용으로 GLM-5.1에 대한 API 액세스를 제공합니다.

이번 출시로 오픈 소스 코딩 모델 공간에서의 경쟁이 더욱 심화되어 GLM-5.1이 폐쇄 소스 제품보다 SWE-Bench Pro에서 선두에 놓이게 되었습니다. Z.ai는 모델의 기능이 Claude Opus 4.6과 일치한다고 주장하지만, 독립적인 평가에 따르면 Opus 4.6의 광범위한 코딩 점수의 약 94.6%를 달성하여 추론 및 창의적 작업에 약간의 격차가 있음을 나타냅니다.

<시간 />

추천 이미지 크레딧

Z.ai, GLM-5.1 모델 출시, 벤치마크 경쟁사 압도

Related Stories

Apple, 베타 3에 더욱 개인화된 Siri 음성 제어 기능 제공

Apple, watchOS 27 베타 3의 Apple Watch에서 Siri AI 활성화

Midjourney는 Disney와 다른 사람들에게 소송에서 내부 AI 사용을 공개하도록 강요합니다.

메타 테스트 독립형 Pocket 앱으로 AI 게임 제작