이전에 Zhipu AI로 알려진 Z.ai는 화요일에 GLM-5.1 모델을 출시했습니다. 이 오픈 소스 플래그십 모델은 에이전트 엔지니어링을 위해 설계되었으며 최대 8시간 동안 단일 코딩 작업을 자동으로 처리하고 연속 루프에서 계획, 실행, 테스트 및 최적화를 수행할 수 있습니다.

GLM-5.1 모델은 SWE-Bench Pro 벤치마크에서 58.4점을 얻어 GPT-5.4, Claude Opus 4.6 및 Gemini 3.1 Pro를 능가했습니다. 이번 릴리스는 2월에 7,440억 매개변수의 Mixture-of-Experts 모델로 도입된 GLM-5의 사후 학습 개선을 따릅니다. 이 모델은 토큰당 약 400억 개의 활성 매개변수를 활용하고 Nvidia 하드웨어 없이 Huawei Ascend 칩에서 전적으로 학습되었습니다.

Z.ai의 문서에 따르면 GLM-5.1은 다중 작업 감독 미세 조정 및 강화 학습 단계와 같은 기술을 통해 코딩 및 에이전트 기능을 향상시킵니다. 이 모델은 전체 “실험-분석-최적화” 루프를 완료하여 8시간 동안 자율 실행을 유지할 수 있습니다. 시연을 통해 8시간 만에 완전한 Linux 데스크톱 시스템을 처음부터 성공적으로 구축하여 655번의 반복을 실행하고 벡터 데이터베이스 쿼리 처리량을 6.9배 늘렸습니다.

GLM-5.1은 200,000개 토큰의 컨텍스트 창을 제공하고 최대 128,000개의 출력 토큰을 지원합니다. 에이전트 코딩 워크플로에 최적화되었으며 Claude Code 및 OpenClaw와 같은 도구와 호환됩니다. 이 모델은 KernelBench 레벨 3 최적화 벤치마크에서 실제 기계 학습 워크로드에 대해 3.6배의 기하 평균 속도 향상을 달성했습니다.

  새로운 Visa 플랫폼을 통해 AI 에이전트가 자율적으로 상품 대금을 지불할 수 있습니다.

GLM-5.1은 모든 GLM 코딩 계획 가입자가 사용할 수 있으며 해당 가중치는 MIT 라이센스에 따라 게시됩니다. 지난 1월 홍콩 증권 거래소에 313억 달러의 가치로 상장된 Z.ai는 백만 입력 토큰당 $1.00, 백만 출력 토큰당 $3.20의 비용으로 GLM-5.1에 대한 API 액세스를 제공합니다.

이번 출시로 오픈 소스 코딩 모델 공간에서의 경쟁이 더욱 심화되어 GLM-5.1이 폐쇄 소스 제품보다 SWE-Bench Pro에서 선두에 놓이게 되었습니다. Z.ai는 모델의 기능이 Claude Opus 4.6과 일치한다고 주장하지만, 독립적인 평가에 따르면 Opus 4.6의 광범위한 코딩 점수의 약 94.6%를 달성하여 추론 및 창의적 작업에 약간의 격차가 있음을 나타냅니다.

<시간 />

추천 이미지 크레딧