Luma AI는 Ray3 추론 비디오 모델을 공개합니다

AI 중심 이미지 및 비디오 생성의 저명한 플레이어 인 Luma AI는 정밀도가 향상된 복잡한 액션 시퀀스를 해결하도록 설계된 취임식 비디오 모델 인 Ray3을 공개했습니다. Ray3은 생성 AI 비디오 기술의 상당한 발전을 나타내므로 제작자는 시간이 지남에 따라 일관성을 유지하는보다 정교한 클립을 생성 할 수 있습니다. Ray3의 혁신의 핵심은 추론 능력으로 전통적인 모델과 차별화됩니다. 텍스트 프롬프트를 비주얼로 직접 변환하는 표준 AI 시스템과 달리 Ray3와 같은 추론 모델은 추가 컴퓨팅 리소스를 할당하여 요청을 철저히 처리합니다. 여기에는 출력을 개선하고 오류를 줄이고 세부 사항을 추가하는 자체 체크 메커니즘이 포함됩니다. 비디오 생성의 경우, 이는 더 긴 시퀀스에서 볼 수있는 일반적인 저하없이 복잡한 프롬프트를 처리하는 것을 의미합니다. 업계 벤치 마크에 따르면 대부분의 AI 생성 비디오는 5 대 10 초 범위에서 번성하며, 연장 된 기간은 종종 불일치 또는 “원한”결과를 초래합니다. Ray3는 제작물을 체계적으로 평가하고 반복하여 이러한 문제를 완화하여 이전에 도전했던보다 고급 장면을 가능하게합니다. Luma AI CEO Amit Jain은 CNET과의 인터뷰에서 모델의 평가 능력을 강조했습니다. Jain은 Ray3가 간단한 텍스트 간 변환을 어떻게 초월하여 컨텐츠 품질을 활성으로 향상시키는지를 강조하면서 “이것은 ‘아, 이런 식으로 더 나은 방법이 필요하지 않거나 이런 식으로 더 나은 방법이 필요하다”고 평가할 수있다. Ray3는 추론 엔진을 보완하여 사용자를위한 실용적인 도구를 소개합니다. 새로운 시각적 주석 기능은 모델의 의사 결정 프로세스에 대한 투명성을 제공하여 조정을위한 문자의 마커와 같은 주석을 표시하거나 변경되지 않은 영역을 보존합니다. 이를 통해 사용자는 프레임을 표시하고 후속 프롬프트에 대한 수정을 지정하여 반복 창의성을 촉진 할 수 있습니다. 또한 Ray3은 16 비트 HDR 형식의 생성을 지원하여 표준 출력에 비해 우수한 해상도, 더 미세한 세부 사항 및 향상된 선명도를 제공합니다. 워크 플로를 간소화하기 위해 Luma AI는 프로토 타이핑을 가속화하는 드래프트 모드를 구현했습니다. 이 모드에서 사용자는 약 20 초 안에 저해상도 클립을 생성 할 수 있으며 개념을 테스트하는 데 이상적입니다. Jain에 따르면 이들 초안은 고 충실도 버전으로 고급화 될 수 있으며, 2 ~ 5 분이 걸리는 프로세스는 2 ~ 5 분이 걸립니다. 이러한 특징은 Ray3을 전문 제작자와 AI 애호가 모두 효율적이고 고품질의 비디오 제작을위한 다재다능한 도구로 위치합니다. Ray3의 출시는 업계 대기업의 AI 비디오 모델이 급증하면서 도착합니다. Midjourney 및 Google의 VEO 3과 같은 경쟁 업체는 품질 높은 품질, 오디오 통합 (VEO 3에서와 같이) 및 전문 사용자를 유치 할 수있는 광범위한 접근성에 중점을 두어 자신의 제품을 비슷하게 발전 시켰습니다. 그러나 이러한 기술의 급속한 확산은 창조적 인 커뮤니티 내에서 우려를 불러 일으켰습니다. 전문가들은 데이터 교육 관행 및 배포 위험을 포함하여 AI 생성 미디어의 윤리적 영향에 대한 경보를 높였습니다. 이로 인해 AI 회사에 대한 아티스트가 제출 한 여러 반응 소송이 제기되어 저작권이있는 작품의 오용이 발생했습니다. LUMA AI는 개인 정보 보호 정책의 사용자 데이터 처리를 주소적으로 제공하며, 제공된 정보가 서비스를 개선하고 향상시키는 데 사용될 수 있다고 진술합니다. AI 비디오 환경이 발전함에 따라 Ray3와 같은 혁신은 모델링 모델이 창의적인 도구의 격차를 해소하는 동시에 생성 기술의 지속 가능성과 공정성에 대한 지속적인 토론을 탐색 할 수있는 잠재력을 강조합니다.

Apple은 AirTag: 사양, 가격 및 사용 방법을 발표했습니다.

Source: Luma AI는 Ray3 추론 비디오 모델을 공개합니다