Nvidia는 긴 컨텍스트 AI에 대한 Rubin CPX GPU를 발표했습니다

Nvidia는 AI Infra Summit에서 “Rubin CPX”GPU를 발표했으며, 대규모 컨텍스트 AI 모델을 위해 설계된 다가오는 “Rubin”제품군의 특수 가속기입니다. 2026 년 후반에 예상 된이 칩은 128GB의 GDDR7 메모리를 갖춘 모 놀리 식 다이에 30 개의 페타 플롭의 NVFP4 컴퓨팅을 제공합니다. 이 모 놀리 식 구성은 Nvidia의 현재 Blackwell 및 Blackwell Ultra Architectures의 듀얼 GPU 패키지와 나머지 Rubin 제품군이 따를 것입니다. Rubin CPX는 확장 된 컨텍스트 시나리오에서 계산 병목 현상을 다루며 포괄적 인 소프트웨어 코드베이스 분석 및 시간 긴 비디오 처리와 같은 응용 프로그램을 위해 수백만 개의 토큰을 동시에 처리하여 최대 백만 개의 토큰이 필요할 수 있습니다. 이 프로세서는 4 개의 NVENC 및 4 개의 NVDEC 비디오 인코더 온칩을 통합하여 간소화 된 멀티미디어 워크 플로를 가능하게합니다. NVIDIA는 Rubin CPX가 현재 GB300 Blackwell Ultra Accelerator 시스템의주의 처리 속도의 3 배를 제공한다고 말합니다. 이 아키텍처는 비용 최적화 된 단일 다이 접근 방식을 사용하여 계산 밀도를 유지하면서 제조 복잡성을 줄입니다. 메모리 대역폭 사양은 공개되지 않지만 512 비트 인터페이스는 30Gbps GDDR7 메모리 칩으로 약 1.8TB/s 처리량을 생성 할 수 있습니다. NVIDIA는 Rubin CPX 프로세서를 Vera Rubin NVL144 CPX 플랫폼에 통합하여 전통적인 Rubin GPU와 특수 CPX 변형을 결합 할 계획입니다. 이 하이브리드 설정은 전체 랙 배치를 통해 8 개의 골재 컴퓨팅과 1.7 pb/s의 메모리 대역폭을 목표로합니다. “Kyber”랙에는 1600g 네트워킹이 장착 된 ConnectX-9 네트워크 어댑터, 102.4T 스위칭이 장착 된 Spectrum6 및 공동 포장 된 광학이 포함됩니다. Nvidia는 Rubin CPX를 Rubin 제품군의 일회성으로 마케팅하여 테스트 시간 스케일링 AI 시스템의 복잡성을 처리하고 있습니다. 모델이 정교한 추론 에이전트로 진화함에 따라 계산 집약적 인 컨텍스트 처리와 메모리 대역폭 의존성 토큰 생성 사이의 추론 분할. CPX 디자인은 이러한 듀얼 요구 사항에 최적화되어 있으며 256,000 개의 토큰 또는 코드 분석이 10 만 줄을 초과하는 Enterprise Chatbot의 컨텍스트 프리 필 작업을 처리합니다. 이 전문화는 확장 된 상호 작용에 걸쳐 지속적인 메모리가 필요한 AI 시스템에 중요하며, NVIDIA는이 하드웨어를 원활하게 활성화하는 것을 목표로합니다. NVIDIA의 빠른 개발주기는 재무 성과를 늘 렸으며 회사는 가장 최근 분기에 41 억 달러의 데이터 센터 판매를보고했습니다.

Age of Empires Mobile이 당신의 휴대폰에 전략을 가져다줍니다

Source: Nvidia는 긴 컨텍스트 AI에 대한 Rubin CPX GPU를 발표했습니다

Nvidia는 긴 컨텍스트 AI에 대한 Rubin CPX GPU를 발표했습니다

Related Stories

Xiaomi 18 Pro는 Snapdragon 8 Elite Gen 6과 함께 9월에 데뷔할 예정입니다.

지속적인 감정 추적을 위한 메타 특허 AI 웨어러블

Elon Musk는 X가 수정된 게시물에 대해 사용자에게 메시지를 보낼 것이라고 말했습니다.

갤럭시 Z 플립 8 유출에는 세 가지 색상 옵션이 표시됩니다.