Microsoft는 널리 사용되는 25개 언어에서 음성-텍스트 정확도를 달성하는 AI 전사 모델인 “MAI-Transcribe-1″을 출시했습니다. 이 모델은 회의, 자막, 받아쓰기와 같은 애플리케이션을 제공하는 것을 목표로 합니다.

MAI-Transcribe-1은 다른 모델인 MAI-Voice-1 및 MAI-Image-2와 함께 Microsoft Foundry에서 제공될 예정입니다. 마이크로소프트는 이번 출시를 통해 “MAI 모델이 처음으로 상업적으로 광범위하게 사용 가능”해 고객이 전사, 음성 및 이미지 생성에서 AI를 활용하는 애플리케이션을 평가하고 구축할 수 있게 되었다고 밝혔습니다.

MAI-Voice-1은 확장된 콘텐츠 전체에서 화자의 정체성과 감정적 뉘앙스를 유지하는 초현실적인 음성 생성 기능을 갖추고 있습니다. 여기에는 녹음된 오디오 1분만으로 맞춤형 브랜드 음성을 개발할 수 있는 음성 안내 기능이 포함되어 있습니다.

한편, MAI-Image-2는 자연스러운 조명, 정확한 피부 톤, 이미지 내 선명한 텍스트 렌더링에 탁월한 새로운 텍스트-이미지 생성 모델입니다. 이 모델은 Arena.ai 텍스트-이미지 리더보드에서 상위 3위 안에 들었습니다.

  Threads, AI 동향 요약을 더 많은 국가로 확장

Microsoft는 OpenAI 기술에 대한 의존도를 계속해서 줄이고 있습니다. 회사는 높은 비용과 느린 응답 시간으로 인해 GPT-4를 비판했습니다. 따라서 Microsoft는 자체 내부 AI 모델 개발을 시작했으며 Copilot 기능에 대한 타사 모델을 평가하고 있습니다.

마이크로소프트의 AI CEO인 무스타파 술레이만(Mustafa Suleyman)은 “오프프론티어(off-frontier)” AI 모델 개발에 초점을 맞추면서 OpenAI 제품의 정교함에 도달하지 못할 것이라고 언급했습니다. 최근 Microsoft의 Copilot 리더십 구조 조정으로 인해 Copilot 경험, Copilot 플랫폼, Microsoft 365 앱 및 AI 모델의 4개 부문이 구성되었습니다. 전 Snap 임원이었던 Jacob Andreou는 Copilot 경험 부문을 이끌고 Microsoft CEO Satya Nadella에게 보고하게 됩니다.

세일즈포스(Salesforce) CEO 마크 베니오프(Marc Benioff)는 이전에 마이크로소프트가 미국 전역에 데이터 센터를 구축하기 위한 5000억 달러 규모의 스타게이트 프로젝트 포기를 포함해 OpenAI가 직면한 과제를 지적하면서 OpenAI 기술 사용을 중단할 것이라고 밝혔습니다.

<시간 />

추천 이미지 크레딧