알리바바 AI(Alibaba AI)는 정지된 인물 사진을 실제와 같은 애니메이션 비디오로 변환할 수 있는 EMO(Emote Portrait Alive)라는 획기적인 기술을 공개했습니다.
AI가 비디오에 대한 우리의 생각을 바꾸고 있으니 준비하세요! OpenAI 및 Alibaba와 같은 회사는 새로운 도구로 우리의 마음을 사로잡고 있습니다. OpenAI의 Sora를 기억하시나요? 텍스트만으로 전신 비디오 캐릭터를 만들 수 있습니다. 이제 Alibaba에는 오래된 초상화를 생생하게 만들 수 있는 EMO(“Emote Portrait Alive”)라는 기능이 있습니다.
특히 비디오 제작을 좋아하거나 AI에 매료된 경우에는 큰 문제입니다. EMO의 작동 방식과 EMO를 사용하여 어떤 놀라운 일을 할 수 있는지 자세히 살펴보겠습니다.
Alibaba AI EMO(Emote Portrait Alive)란 무엇입니까?
EMO는 알리바바가 개발한 고급 AI 시스템으로, 단일 스틸 이미지에서 사실적인 말하고 노래하는 동영상을 생성할 수 있습니다. 오디오 중심의 말하는 머리 비디오 생성을 활용하여 믿을 수 없을 정도로 생생한 애니메이션을 만듭니다.
EMO의 작동 방식을 분석해 보겠습니다.
- 단일 이미지 입력: EMO의 마법은 인물 사진 한 장에서 시작됩니다. 역사적 인물일 수도 있고, 가상의 인물일 수도 있고, 자신의 사진일 수도 있습니다.
- 오디오 입력: 초상화에 애니메이션을 적용하려면 EMO에 음성 또는 노래 중 하나의 오디오 입력이 필요합니다.
- AI 마법: EMO의 정교한 AI 알고리즘이 이미지와 오디오를 모두 분석하여 제공된 오디오와 완벽하게 동기화되는 정확한 얼굴 표정, 입 모양, 머리 움직임을 생성합니다.
Alibaba AI EMO는 놀랍도록 사실적인 애니메이션을 제작하는 능력으로 차별화됩니다. 생성된 비디오는 실제 영상과 구별할 수 없는 경우가 많아 AI 기반 콘텐츠와 현실 사이의 경계가 모호해집니다. 이러한 수준의 현실감은 AI 기반 애니메이션 기술의 중요한 진전입니다.
EMO는 실제와 같은 움직임을 넘어 노래와 음성 오디오를 모두 쉽게 처리합니다. 음성 녹음을 제공하든 노래를 제공하든 EMO는 오디오에 맞는 적절한 표현으로 초상화에 애니메이션을 적용합니다. 이러한 다용성으로 인해 다양한 응용 분야에 사용할 수 있는 강력한 도구가 됩니다.
EMO는 또한 애니메이션 비디오의 지속 시간이 오디오 입력 길이에 따라 결정되도록 하여 유연성을 제공합니다. 즉, 필요에 따라 짧은 클립이나 더 길고 심층적인 애니메이션을 만들 수 있습니다.
잠깐, 알리바바에 AI 연구 프로젝트 팀이 있나요?
알리바바는 중요한 AI 연구 프로젝트를 진행 중이다.
2017년에는 AI, 머신러닝, 데이터 인텔리전스와 같은 첨단 기술 탐구에 전념하는 글로벌 연구 이니셔티브인 DAMO 아카데미(Discovery, Adventure, Momentum, Outlook)를 설립했습니다. Alibaba는 광범위한 전자상거래 플랫폼과 기타 다양한 영역에 AI를 적극적으로 적용합니다.
예를 들어 AI는 스마트 물류 시스템 내에서 배송 경로와 창고 관리를 최적화하는 역할을 합니다. 또한 자연어 처리를 통해 챗봇과 고객 서비스를 강화하고 고객을 위한 맞춤형 제품 추천을 제공합니다. Alibaba는 이러한 노력에 수십억 달러를 투자함으로써 AI 연구에 대한 의지를 보여줍니다.
딥페이크 전염병
Alibaba AI의 EMO는 이미 우려하고 있는 딥페이크 세계에 심각한 위험을 초래합니다. 사기성 콘텐츠를 훨씬 쉽게 만들 수 있는 잠재력이 있습니다. EMO를 사용하면 광범위한 기술 지식이 없는 사람도 사람들이 한 번도 해본 적이 없는 말을 하는 사실적인 비디오를 생성할 수 있습니다. EMO의 고급 애니메이션 기술은 이러한 딥페이크를 더욱 설득력 있게 만들어 실제와 조작된 것 사이의 경계를 모호하게 만듭니다. 오디오 입력만으로 사람의 초상을 조작하는 능력은 잠재적으로 파괴적인 허위 진술의 가능성을 열어줍니다.
EMO는 AI 기반 조작의 놀라운 기능을 강조합니다. 이러한 종류의 기술은 잘못된 사람의 손에 들어가면 위험할 수 있으며 보다 엄격한 규정과 보호 조치가 시급히 필요하다는 점을 강조합니다. 잠재적인 피해는 단순한 인신공격에서부터 미디어에 대한 신뢰를 완전히 불안정하게 만들 수 있는 대규모 잘못된 정보 캠페인에 이르기까지 다양합니다. 이러한 부정적인 결과를 방지하기 위해 극도의 주의를 기울여 EMO 및 유사한 기술에 접근하는 것이 중요합니다.
여기에서 전체 연구 논문을 확인하세요.
주요 이미지 크레딧: 마크 데인즈/Unsplash.
Source: Alibaba AI, EMO로 OpenAI Sora와 경쟁