MiniMax는 개발자와 AI 에이전트가 생성 기능에 직접 액세스할 수 있도록 AI 플랫폼을 위한 Node.js 기반 명령줄 인터페이스인 MMX-CLI를 출시했습니다.

MMX-CLI는 추가 통합 계층 없이 미디어를 생성하는 데 어려움을 겪는 LLM(대형 언어 모델) 기반 에이전트가 직면한 문제를 해결합니다. 새로운 인터페이스를 통해 사용자는 다양한 미디어 생성 기능을 쉘 명령으로 직접 호출할 수 있으므로 모델 컨텍스트 프로토콜이 필요하지 않습니다.

인터페이스는 MiniMax의 기능을 mmx 텍스트, mmx 이미지, mmx 비디오, mmx 음성, mmx 음악, mmx 비전 및 mmx 검색의 7가지 명령 그룹으로 통합합니다. 각 명령은 개발자와 AI 애플리케이션에 맞춰진 특정 기능을 제공합니다.

mmx 텍스트 명령은 다중 회전 채팅을 지원하고 특정 MiniMax 모델 변형을 대상으로 합니다. 기본적으로 MiniMax-M2.7을 사용하므로 고급 텍스트 생성 작업이 가능합니다. mmx 이미지 명령을 사용하면 텍스트 프롬프트에서 이미지를 생성할 수 있어 여러 출력에 걸쳐 종횡비 및 피사체 일관성에 대한 옵션을 제공할 수 있습니다. 이 기능은 시각적 연속성이 필요한 작업 흐름을 지원합니다. mmx 비디오 명령은 동기 폴링 또는 비동기 작업 추적 옵션과 함께 비디오 생성을 위해 MiniMax-Hailuo-2.3을 활용합니다. 사용자는 명령 플래그를 사용하여 비디오 생성을 위한 시작 프레임을 지정할 수 있습니다.

  새로운 Anthropic 서비스로 AI 에이전트 구축 시간을 몇 개월에서 몇 주로 단축

MMX-CLI의 mmx 음성 명령은 30개 이상의 텍스트 음성 변환 기능을 제공합니다. 이를 통해 사용자는 자막 타이밍을 지원하면서 속도, 볼륨, 피치와 같은 매개변수를 조정할 수 있습니다. 입력은 10,000자로 제한됩니다.

mmx music 명령을 사용하면 사용자는 텍스트 입력에서 음악을 생성하고 장르 및 악기와 같은 다양한 구성 매개변수를 정의할 수 있습니다. 워터마크 삽입 옵션도 포함되어 있습니다. mmx 비전 명령은 비전 언어 모델을 사용하여 이미지를 해석하므로 사용자가 프롬프트를 통해 이미지의 내용을 문의할 수 있습니다.

mmx 검색 명령은 웹 검색을 용이하게 하며 결과를 텍스트 또는 JSON 형식으로 반환합니다. 명령 구조와 기본 기술 아키텍처는 모두 다양한 환경에서 유용하도록 최적화되어 있습니다. MMX-CLI는 주로 TypeScript로 개발되었으며 Node.js 18+와 호환됩니다. 배포는 간단하며 구조화된 오류 처리 및 이중 지역 API 라우팅 지원 기능을 갖추고 있습니다.

MiniMax는 MMX-CLI가 다양한 미디어 생성 기능을 위한 통합 도구를 제공함으로써 AI 개발의 통합 장벽을 크게 줄여준다고 밝혔습니다. 이는 AI 에이전트를 위한 간편한 설정과 결합되어 지능형 애플리케이션 구축 프로세스를 간소화합니다.

  구글, 개인정보(Personal Intelligence)를 전 세계로 확장

<시간 />

추천 이미지 크레딧