OpenAI는 ChatGPT 고급 음성 모드를 통해 챗봇과 현실적인 대화를 할 수 있는 길을 열었습니다. 이 회사는 우리가 사람처럼 AI와 소통하고 이제 사람처럼 대화할 수 있도록 할 것입니다. 현재 제한된 수의 Plus 멤버에게만 제공되는 ChatGPT 고급 음성 모드를 살펴보겠습니다.
AI와 상호작용하는 방식에 혁명을 일으킬 이 최첨단 기능은 기술 자체만큼이나 흥미로운 토론을 불러일으키고 있습니다. 야, Jarvis, 거기 있어?
ChatGPT Plus 사용자 소수에게 고급 음성 모드를 출시하기 시작했습니다. 고급 음성 모드는 보다 자연스럽고 실시간 대화를 제공하고, 언제든지 방해할 수 있으며, 감정을 감지하고 반응합니다. pic.twitter.com/64O94EhhXK
— OpenAI (@OpenAI) 2024년 7월 30일
ChatGPT 고급 음성 모드: 단순한 대화 이상
OpenAI의 최신 제품은 평범한 음성 비서가 아닙니다. ChatGPT Advanced Voice Mode는 인간과 AI의 경계를 모호하게 하는 매우 사실적인 음성 응답을 제공한다고 합니다. 음성 입력을 처리하기 위해 세 개의 별도 모델에 의존했던 이전 제품과 달리, GPT-4o(이 새로운 기능의 엔진)는 멀티모달 작업을 모두 한 번에 처리할 수 있습니다. 음성-텍스트 변환, 프롬프트 처리, 텍스트-음성 출력을 모두 한 번에 처리할 수 있는 기계를 상상해 보세요. 로봇과 대화하고 있다는 사실을 잊게 만드는 유창한 대화가 멀지 않았습니다.
하지만 잠깐만요, 그게 다가 아닙니다! 이 AI 채팅박스는 감정적 음조를 감지할 수 있다고 주장합니다. 슬픈지 흥분한지 알아낼 수 있습니다. 심지어 노래방에 함께 갈 수도 있지만 저작권이 있는 곡을 부를 거라고 기대하지 마세요. 먼저 ChatGPT 고급 음성 모드를 사용하는 방법을 살펴보겠습니다.

ChatGPT 고급 음성 모드 사용 방법
손가락을 쉬게 하고 성대를 운동시킬 준비가 되셨나요? OpenAI의 최신 창작품으로 대화를 시작하는 방법은 다음과 같습니다. ChatGPT 고급 음성 모드는 현재 제한된 수의 ChatGPT Plus 사용자(모든 Plus 회원이 액세스할 수 있는 것은 아님)하지만 당신이 그들 중 한 명인 경우에만 가능합니다:
- 앱을 업데이트하세요: 우선, ChatGPT 앱의 최신 버전을 실행하고 있는지 확인하세요. Android 사용자의 경우 버전 1.2024.206 이상입니다. iOS 사용자의 경우 버전 1.2024.205 이상이 필요하며 기기에서 iOS 16.4 이상을 실행해야 합니다. 이 미래형 파티에서는 오래된 기술은 허용되지 않습니다!
- 당신의 목소리를 찾으세요: 모든 업데이트가 완료되면 화면 오른쪽 하단에 숨어 있는 음성 아이콘을 찾으세요. 탭하면 시작할 준비가 됩니다.
- 당신의 전투기를 선택하세요: 표준 음성 모드와 새롭고 멋진 고급 음성 모드 중에서 선택할 수 있습니다. GPT-4o의 모든 기능을 경험하려면 “고급”을 선택하세요.
- 발언: 마이크는 기본적으로 켜져 있어야 하지만, 무음 처리를 받는 경우 화면 왼쪽 하단에 있는 마이크 아이콘을 확인하세요. 필요한 경우 탭하여 전환하세요.
- 채팅하세요: AI 친구와 인간 친구와 대화하듯 자연스럽게 대화를 시작하세요. 기억하세요, AI는 여러분의 감정을 이해할 수 있으니, 개성을 마음껏 드러내세요.
- 그것을 포장하다: 새로운 AI 스피커에 영향을 미치는 일(또는 영향을 받는 일)이 끝나면 오른쪽 하단에 있는 빨간색 아이콘을 눌러 대화를 종료하세요.
프로 팁: 최상의 경험을 위해 헤드폰을 착용하세요. 그리고 iPhone 사용자는 다음을 활성화하세요. 음성 분리 원치 않는 방해를 피하기 위해 마이크 모드를 사용하세요. 결국, AI 조수와 마음을 터놓고 이야기하려면 3명이면 무리입니다!
이 기능은 아직 알파 단계에 있으므로 몇 가지 문제가 있을 수 있습니다. 하지만 인간도 항상 100% 완벽한 대화자는 아니잖아요, 그렇죠?

스칼렛 요한슨: 논란의 목소리
OpenAI가 새로운 음성 기능인 ChatGPT Advanced Voice Mode의 고급 기능을 자랑해 온 반면, 출시까지 순탄치만은 않았습니다. 5월에 있었던 놀라운 데모를 기억하시나요? Sky라는 음성 중 하나가 할리우드 스타.
영화 “Her”에서 AI 조수 역을 맡은 것으로도 유명한 스칼렛 요한슨은 OpenAI CEO 샘 알트먼이 자신의 목소리를 사용하라는 요청을 여러 번 거부한 것으로 알려졌습니다. 요한슨은 자신의 목소리와 의심스럽게 비슷한 목소리가 담긴 데모가 공개되었을 때 “인공지능”이라고 부를 수 있는 것을 옹호하는 데 더 빨랐습니다. OpenAI는 그녀의 목소리를 사용한 것을 부인했지만 논란이 되는 샘플을 즉시 프로그램에서 제거했습니다.

안전은 최우선, 스타렛은 그 다음
논란에 대응하여 OpenAI는 출시에 브레이크를 걸고 보안 조치를 강화하는 데 시간을 들였습니다. 이 회사는 45개 언어를 구사하는 100명 이상의 외부 레드팀 멤버와 함께 GPT-4o를 테스트했다고 주장합니다. 그 결과, 유료 성우와 협력하여 Juniper, Breeze, Cove, Ember의 4가지 사전 설정 음성을 갖춘 보다 안전한 시스템이 만들어졌습니다.
OpenAI 대변인 린지 맥캘럼은 ChatGPT가 “개인과 공인 모두 다른 사람의 목소리를 모방할 수 없으며, 이러한 사전 설정된 목소리 중 하나와 다른 출력을 차단할 것”이라고 확언했습니다. 따라서 가상의 스칼렛 요한슨과 채팅하기를 바랐다면 운이 없었습니다.
OpenAI가 점진적으로 ChatGPT 고급 음성 모드를 출시함에 따라 모든 플러스이번 가을 사용자기술계는 숨을 죽이고 지켜본다. 이것이 우리 모두가 기다려온 대화형 AI가 될까, 아니면 AI 윤리와 저작권 문제에 대한 진행 중인 논쟁에서 새로운 난제를 불러올까?
추천 이미지 크레딧: X / OpenAI 편집: Furkan Demirkaya
Source: ChatGPT 고급 음성 모드: 스칼렛이 목소리를 잊게 함








