텍스트 설명만 있으면 모든 장르의 음악을 작곡할 수 있는 획기적인 AI 시스템인 Google MusicLM AI가 도입되었습니다. 인상적인 기능에도 불구하고 회사는 신중한 선택을 했으며 공개적으로 사용할 수 있도록 현재 계획이 없습니다. Riffusion 및 Dance Diffusion과 같은 이전의 음악용 제너레이티브 AI 시스템은 작곡을 시도했지만 기술적 제약과 불충분한 훈련 데이터로 인해 복잡성과 충실도가 부족한 작곡이 이루어졌습니다. 그러나 Google MusicLM AI는 상당한 도약을 의미하며 이러한 문제를 극복하는 최초의 시스템일 수 있습니다.
와우, 이것은 나에게 ChatGPT보다 큽니다.
Google은 음악 세대를 거의 해결했습니다. https://t.co/s9PQaJ5R6A— 최근우(@keunwoochoi) 2023년 1월 27일
최초의 중요한 텍스트 음악 변환 도구인 Google MusicLM AI를 만나보세요.
최근 학술 논문에서는 280,000시간 분량의 음악으로 구성된 대규모 데이터 세트에서 훈련된 AI 시스템인 MusicLM의 개발을 강조합니다. 시스템의 목표는 “기억에 남을 색소폰 솔로와 솔로 가수가 있는 매혹적인 재즈 곡” 또는 “낮은 베이스와 강한 킥이 있는 베를린의 90년대 테크노”와 같은 텍스트 설명을 기반으로 “상당히 복잡한” 곡을 생성하는 것이었습니다. Google MusicLM AI가 생성한 출력물은 반드시 인간 예술가만큼 상상력이 풍부하거나 음악적으로 통합되지는 않지만 그럼에도 불구하고 인간이 작곡한 음악과 놀라울 정도로 유사합니다.
특히 창작 과정에 인간 음악가나 악기 연주자가 없다는 점을 감안할 때 Google MusicLM AI가 생성한 결과물이 얼마나 인상적인지 표현하는 것은 절제된 표현일 것입니다. 때때로 길고 복잡한 설명이 제공되지만 MusicLM은 작곡에 기악 리프, 멜로디 라인 및 감정적 저음과 같은 복잡한 요소를 통합하는 놀라운 능력을 가지고 있습니다.

Google MusicLM AI의 능력은 단순한 짧은 음악 스니펫 생성 그 이상입니다. Google 연구 팀은 흥얼거리거나, 노래하거나, 휘파람을 불거나, 악기로 연주하든 기존의 멜로디를 구성하는 시스템의 능력을 시연했습니다. 또한 MusicLM은 여러 개의 순차적 설명을 취하고 몇 분에 걸친 멜로디 내러티브를 만들어 영화 사운드트랙에 적합하도록 만드는 기능이 있습니다.
Google MusicLM AI의 다재다능함은 이미지와 캡션의 조합을 통해 지시되고 특정 장르 내 특정 악기의 사운드를 모방하는 오디오를 생성하는 데까지 확장됩니다. AI “음악가”의 전문성도 조정할 수 있어 시스템이 다양한 위치, 기간 또는 신체 운동을 위한 고양 음악과 같은 특정 목적에 영향을 받는 음악을 생성할 수 있습니다.
Google MusicLM AI의 GitHub 페이지에 접속하여 일부 샘플을 들을 수 있습니다!
Google AI 음악 작곡가는 정말 좋은가요?
그러나 Google MusicLM AI에 결함이 없는 것은 아닙니다. 시스템에서 생성된 출력 중 일부는 교육 절차의 자연스러운 결과인 분리된 품질을 나타낼 수 있습니다. 합창 하모니를 포함한 보컬을 생성하는 시스템의 능력은 기대에 미치지 못합니다. 생성된 가사는 엉뚱한 영어나 의미 없는 횡설수설로 구성되어 있어 이해하기 어려운 경우가 많으며, 합성된 보컬은 단일 아티스트의 세련미가 부족하고 대신 다양한 목소리가 혼합된 것처럼 들립니다.
Google의 새로운 음악 모델 MusicLM은 금주의 돌파구입니다.
여기에서 작동 중입니다.
음악을 설명하면 트랙이 생성됩니다. pic.twitter.com/xAhzHfGnMH
— 피트(@nonmayorpete) 2023년 1월 27일
인상적인 기능에도 불구하고 Google 연구원은 교육 데이터의 저작권 자료를 생성된 노래에 통합할 가능성을 포함하여 MusicLM과 같은 시스템이 제기하는 수많은 윤리적 딜레마를 인정합니다. 실험 중에 생성된 음악의 약 1%가 훈련 데이터 세트의 노래와 정확히 일치한다는 사실을 발견했습니다. 이러한 높은 복제 빈도로 인해 연구원들은 Google MusicLM AI를 현재 형태로 출시하지 않기로 결정했습니다.
“우리는 사용 사례와 관련된 창의적인 콘텐츠의 잠재적 오용 위험을 인정합니다. 우리는 음악 생성과 관련된 이러한 위험을 해결하기 위해 더 많은 향후 작업이 필요함을 강력히 강조합니다.”라고 이 논문의 공동 저자는 말했습니다.

MusicLM 또는 이와 유사한 시스템이 향후 출시될 경우 아티스트 지원 여부에 관계없이 시스템이 마케팅 또는 포지셔닝되는 방식에 관계없이 중대한 법적 문제가 발생할 가능성이 높습니다. 이것은 단순한 AI 시스템과 관련하여 이미 제기된 문제입니다. 2020년 Jay-Z의 음반사는 AI를 사용하여 Billy Joel의 “We Didn’t Start the Fire”를 포함한 Jay-Z 노래의 커버를 제작한 것에 대해 YouTube 채널인 Vocal Synthesis에 대해 저작권 침해 소송을 제기했습니다. 처음에 동영상을 삭제한 후 YouTube는 게시 중단 요청이 “불완전”하다고 판단하여 나중에 동영상을 복원했습니다. AI가 생성한 음악의 합법성은 여전히 모호한 영역입니다.
Google은 MusicLM: 텍스트에서 음악을 생성하는 모델을 발표합니다. 다음은 할 수 있는 몇 가지 미친 짓입니다.
1. 멜로디의 오디오가 주어지면 프롬프트에 의해 사용자 정의된 멜로디에서 영감을 얻은 새로운 음악을 생성할 수 있습니다! 아카펠라 합창, EDM 등으로 변신한 벨라 챠오를 허밍하는 사람이 있다. pic.twitter.com/HKDnXI1C8U
—bleedingedgeai(@bleedingedgeai) 2023년 1월 27일
음악 생성을 위한 AI 기술이 계속 발전함에 따라 적법성에 대한 의문이 가장 먼저 제기됩니다. Music Publishers Association의 법률 인턴인 Eric Sunray는 MusicLM과 같은 시스템이 저작권이 있는 자료에서 “일관된 오디오 태피스트리”를 생성함으로써 미국 저작권법에 따라 보호되는 권리를 침해한다고 주장하는 백서를 작성했습니다. 훈련.
이러한 우려는 이미지, 코드 및 텍스트 생성을 포함한 다른 분야의 AI 시스템과 관련하여 학습 데이터가 제작자의 동의 없이 웹에서 제공되는 경우가 많기 때문에 반영되었습니다. 공정 사용 문제는 OpenAI의 Jukebox가 출시된 후 AI 모델 교육에 저작권이 있는 자료를 사용하는 것에 대해 의문을 제기하는 논의도 있었습니다.

Waxy의 Andy Baio의 의견에 따르면 AI 시스템에 의해 생성된 음악은 사용자 관점에서 2차 저작물로 간주되어 원래 구성 요소에 대한 저작권 보호만 제공할 수 있다고 추측됩니다. 이 맥락에서 무엇이 “독창성”을 구성하는지에 대한 정의는 불분명하여 그러한 음악의 상업적 이용을 미지의 영역으로 만듭니다. 그러나 생성된 음악이 패러디나 논평과 같은 공정 사용 범위에 속하는 경우에는 문제가 덜 복잡해집니다. 그럼에도 불구하고 Baio는 법원 시스템이 평결에 도달하기 위해 사례별로 접근해야 한다고 예측합니다.
법적 환경이 계속 발전함에 따라 음악 생성 AI를 둘러싼 문제에 대한 명확성이 임박했을 수 있습니다. 승인이나 인식 없이 AI 시스템 교육에 작품을 활용하는 아티스트의 권리를 다루는 소송을 포함하여 진행 중인 여러 소송이 업계에 영향을 미칠 가능성이 높습니다. 이러한 법적 절차의 결과는 시간만이 밝혀줄 것입니다.
AI 생성 텍스트를 감지하기 위한 OpenAI의 새로운 AI 텍스트 분류기를 들어보셨나요?
