MiniMax는 개발자와 AI 에이전트가 생성 기능에 직접 액세스할 수 있도록 AI 플랫폼을 위한 Node.js 기반 명령줄 인터페이스인 MMX-CLI를 출시했습니다.
MMX-CLI는 추가 통합 계층 없이 미디어를 생성하는 데 어려움을 겪는 LLM(대형 언어 모델) 기반 에이전트가 직면한 문제를 해결합니다. 새로운 인터페이스를 통해 사용자는 다양한 미디어 생성 기능을 쉘 명령으로 직접 호출할 수 있으므로 모델 컨텍스트 프로토콜이 필요하지 않습니다.
인터페이스는 MiniMax의 기능을 mmx 텍스트, mmx 이미지, mmx 비디오, mmx 음성, mmx 음악, mmx 비전 및 mmx 검색의 7가지 명령 그룹으로 통합합니다. 각 명령은 개발자와 AI 애플리케이션에 맞춰진 특정 기능을 제공합니다.
mmx 텍스트 명령은 다중 회전 채팅을 지원하고 특정 MiniMax 모델 변형을 대상으로 합니다. 기본적으로 MiniMax-M2.7을 사용하므로 고급 텍스트 생성 작업이 가능합니다. mmx 이미지 명령을 사용하면 텍스트 프롬프트에서 이미지를 생성할 수 있어 여러 출력에 걸쳐 종횡비 및 피사체 일관성에 대한 옵션을 제공할 수 있습니다. 이 기능은 시각적 연속성이 필요한 작업 흐름을 지원합니다. mmx 비디오 명령은 동기 폴링 또는 비동기 작업 추적 옵션과 함께 비디오 생성을 위해 MiniMax-Hailuo-2.3을 활용합니다. 사용자는 명령 플래그를 사용하여 비디오 생성을 위한 시작 프레임을 지정할 수 있습니다.
MMX-CLI의 mmx 음성 명령은 30개 이상의 텍스트 음성 변환 기능을 제공합니다. 이를 통해 사용자는 자막 타이밍을 지원하면서 속도, 볼륨, 피치와 같은 매개변수를 조정할 수 있습니다. 입력은 10,000자로 제한됩니다.
mmx music 명령을 사용하면 사용자는 텍스트 입력에서 음악을 생성하고 장르 및 악기와 같은 다양한 구성 매개변수를 정의할 수 있습니다. 워터마크 삽입 옵션도 포함되어 있습니다. mmx 비전 명령은 비전 언어 모델을 사용하여 이미지를 해석하므로 사용자가 프롬프트를 통해 이미지의 내용을 문의할 수 있습니다.
mmx 검색 명령은 웹 검색을 용이하게 하며 결과를 텍스트 또는 JSON 형식으로 반환합니다. 명령 구조와 기본 기술 아키텍처는 모두 다양한 환경에서 유용하도록 최적화되어 있습니다. MMX-CLI는 주로 TypeScript로 개발되었으며 Node.js 18+와 호환됩니다. 배포는 간단하며 구조화된 오류 처리 및 이중 지역 API 라우팅 지원 기능을 갖추고 있습니다.
MiniMax는 MMX-CLI가 다양한 미디어 생성 기능을 위한 통합 도구를 제공함으로써 AI 개발의 통합 장벽을 크게 줄여준다고 밝혔습니다. 이는 AI 에이전트를 위한 간편한 설정과 결합되어 지능형 애플리케이션 구축 프로세스를 간소화합니다.
<시간 />








