Nvidia는 AI Infra Summit에서 “Rubin CPX”GPU를 발표했으며, 대규모 컨텍스트 AI 모델을 위해 설계된 다가오는 “Rubin”제품군의 특수 가속기입니다. 2026 년 후반에 예상 된이 칩은 128GB의 GDDR7 메모리를 갖춘 모 놀리 식 다이에 30 개의 페타 플롭의 NVFP4 컴퓨팅을 제공합니다. 이 모 놀리 식 구성은 Nvidia의 현재 Blackwell 및 Blackwell Ultra Architectures의 듀얼 GPU 패키지와 나머지 Rubin 제품군이 따를 것입니다. Rubin CPX는 확장 된 컨텍스트 시나리오에서 계산 병목 현상을 다루며 포괄적 인 소프트웨어 코드베이스 분석 및 시간 긴 비디오 처리와 같은 응용 프로그램을 위해 수백만 개의 토큰을 동시에 처리하여 최대 백만 개의 토큰이 필요할 수 있습니다. 이 프로세서는 4 개의 NVENC 및 4 개의 NVDEC 비디오 인코더 온칩을 통합하여 간소화 된 멀티미디어 워크 플로를 가능하게합니다. NVIDIA는 Rubin CPX가 현재 GB300 Blackwell Ultra Accelerator 시스템의주의 처리 속도의 3 배를 제공한다고 말합니다. 이 아키텍처는 비용 최적화 된 단일 다이 접근 방식을 사용하여 계산 밀도를 유지하면서 제조 복잡성을 줄입니다. 메모리 대역폭 사양은 공개되지 않지만 512 비트 인터페이스는 30Gbps GDDR7 메모리 칩으로 약 1.8TB/s 처리량을 생성 할 수 있습니다. NVIDIA는 Rubin CPX 프로세서를 Vera Rubin NVL144 CPX 플랫폼에 통합하여 전통적인 Rubin GPU와 특수 CPX 변형을 결합 할 계획입니다. 이 하이브리드 설정은 전체 랙 배치를 통해 8 개의 골재 컴퓨팅과 1.7 pb/s의 메모리 대역폭을 목표로합니다. “Kyber”랙에는 1600g 네트워킹이 장착 된 ConnectX-9 네트워크 어댑터, 102.4T 스위칭이 장착 된 Spectrum6 및 공동 포장 된 광학이 포함됩니다. Nvidia는 Rubin CPX를 Rubin 제품군의 일회성으로 마케팅하여 테스트 시간 스케일링 AI 시스템의 복잡성을 처리하고 있습니다. 모델이 정교한 추론 에이전트로 진화함에 따라 계산 집약적 인 컨텍스트 처리와 메모리 대역폭 의존성 토큰 생성 사이의 추론 분할. CPX 디자인은 이러한 듀얼 요구 사항에 최적화되어 있으며 256,000 개의 토큰 또는 코드 분석이 10 만 줄을 초과하는 Enterprise Chatbot의 컨텍스트 프리 필 작업을 처리합니다. 이 전문화는 확장 된 상호 작용에 걸쳐 지속적인 메모리가 필요한 AI 시스템에 중요하며, NVIDIA는이 하드웨어를 원활하게 활성화하는 것을 목표로합니다. NVIDIA의 빠른 개발주기는 재무 성과를 늘 렸으며 회사는 가장 최근 분기에 41 억 달러의 데이터 센터 판매를보고했습니다.

Nvidia는 긴 컨텍스트 AI에 대한 Rubin CPX GPU를 발표했습니다
Written by
Emre’s love for animals made him a veterinarian, and his passion for technology made him an editor. Making new discoveries in the field of editorial and journalism, Emre enjoys conveying information to a wide audience, which has always been a dream for him.
View all posts →Related Stories
NVIDIA, Computex에서 Isaac Gr00t 개방형 휴머노이드 로봇 플랫폼 공개
최고 경영자인 Jensen Huang은 이 플랫폼이 Jetson AGX Thor T5000 온보드 컴퓨터를 기반으로 31 자유도를 갖춘 6피트 높이의...
WWDC 2026에서 기대할 수 있는 것
Apple은 WWDC 2026에서 iOS, macOS 등에 대한 주요 업데이트와 함께 고급 AI를 기반으로 한 대규모 Siri 개편을 공개할...
새로운 스마트 안경과 함께 Meta Eyes AI 펜던트 출시
Meta는 올해 웨어러블 기술 야망을 확장하기 위해 AI 펜던트와 최대 4개의 새로운 스마트 안경 모델을 개발하고 있는 것으로...
Radeon RX 9070 GRE, 중국 데뷔 후 549달러로 전 세계 출시
AMD의 Radeon RX 9070 GRE 그래픽 카드는 1440p 게임 성능, RDNA 4 효율성 및 FSR 4.1 지원을 제공하는...




