ElevenLabs는 AI TEXT-TIECHECH (TTS) 모델의 언어 기능을 크게 확장하여 현재 총 70 개 언어를 지원합니다. 뉴욕시에 본사를 둔 AI 스타트 업은 지난 주에 41 개의 새로운 언어를 추가하면 모델이 전 세계 인구의 약 90%에 액세스 할 수 있다고 발표했습니다.
이 확장은 11 월 8 일에 시작된 11 개의 V3 (알파) 모델에서 구현되어“가장 표현력있는 TTS 모델”으로 선전했습니다. 회사는 이전에 Twitter로 알려진 공식 X 계정을 통해 발표했습니다.
새로 지원되는 언어에는 아랍어, 아삼 어, 벵골어, 불가리아, 카탈로니아어, 구자라트티, 라트비아어, 말레이어, 말라 얄 람어, 마라 티, 네팔, 스와힐리어, 타밀어, 텔루구 어와 같은 다양한 범위가 포함됩니다. 이로 인해 컨텐츠 제작자 및 비즈니스가 더 넓은 청중에게 도달 할 수있는 모델의 유틸리티가 넓어집니다.
ElevenLabs는 새로운 언어로 텍스트를 생성하려는 사용자에게 원하는 언어를 선택하면서 즉각적인 음성 클론 (IVC)을 녹음하기 위해 조언합니다. 또한이 회사는 앞으로 몇 주 안에 새로 지원되는 언어에 대한 음성 라이브러리 음성을 추가 할 계획입니다.
11 개의 V3는 다국어 V2 및 v2.5 TTS 모델의 기초를 기반으로합니다. 11 개의 V3의 주요 특징은 “Whispers”, “Excling”및 “Sighs”를 포함한 인라인 오디오 태그에 대한 지원입니다. 이 태그를 통해 사용자는 감정적 뉘앙스와 비언어적 신호를 생성 된 오디오에 주입하여보다 극적이고 매력적인 전달을 초래할 수 있습니다.
또한이 모델은 다중 스피커 상호 작용을 지원하고 중단, 자연스러운 페이싱 및 중첩 대화로 완료되어보다 현실적인 대화 경험을 만듭니다. Elevenlabs는 11 개의 V3가 응력, 케이던스 및 상황 인식과 같은 요소의 개선 된 취급을 보여줍니다.
11 개의 V3 모델은 현재 회사 웹 사이트 및 모바일 앱을 통해 액세스 할 수 있습니다. 그러나 API (Application Programming Interface)로 아직 사용할 수 없습니다.
이 언어 확장 전에 4 월에 Elevenlabs는 대화식 AI를 위해 설계된 새로운 기업 중심의 에이전트 기능인 에이전트 전송을 도입했습니다. 이 기능을 통해 두 AI 에이전트가 서로 의사 소통하고 관련 대화 데이터와 함께 대화를보다 전문적인 에이전트에게 완벽하게 전달할 수 있습니다.







