Google Muse AI로 알려진 인공 지능 시스템이 오늘 공식적으로 공개되었습니다. 병렬 디코딩 및 작은 이산 잠재 공간의 사용을 기반으로 하는 새로운 텍스트-이미지 변환기 모델은 기존 대안보다 빠르다고 주장합니다. Google Muse AI의 제작자는 자신의 창작물이 최고 중의 최고에 필적하는 수준의 품질로 사진을 생성할 수 있다고 주장합니다.

선물합니다 뮤즈 신확산 또는 자동 회귀 모델보다 훨씬 더 효율적이면서 최첨단 이미지 생성 성능을 달성하는 텍스트-이미지 변환기 모델입니다.

Google Muse AI 팀

Google Muse AI란?

팀은 Google Muse AI가 Imagen 및 DALL-E 2와 같은 이전의 텍스트-이미지 변환기 모델에 비해 크게 개선되었다고 주장합니다. Muse는 큰 언어 모델의 텍스트 임베딩을 사용하여 이산 토큰 공간(LLM ).

Google Muse AI는 무엇이며 예제와 어떻게 작동합니까? Muse by Google의 기능을 알아보고 AI 세계를 탐험하세요.
이미지 제공(MUSE): 오렌지색 비니와 선글라스를 쓰고 칠하자는 표지판을 들고 있는 복슬복슬한 햄스터의 고대비 초상화 사진

Muse는 마음대로 위장한 이미지에서 토큰을 인식할 수 있습니다. 개별 토큰을 사용하고 샘플 크기 요구 사항을 줄였기 때문에 Muse는 Imagen 및 DALL-E 2와 같은 픽셀 공간 확산 모델을 능가할 것을 약속합니다. 이 모델은 응답으로 이미지 토큰을 반복적으로 리샘플링하여 무료 제로 샷, 마스크 없는 편집을 생성합니다. 프롬프트에.

  Apple, iOS 27의 초점을 품질과 기본 성능으로 전환

MUSE의 벤치마크에 따르면 Muse의 추론 시간은 경쟁 모델보다 훨씬 낮습니다.

모델해결추론 시간(↓)
안정적인 확산 1.4512×5123.7초
파티-3B256×2566.4초
이미지256×2569.1초
이미지1024×102413.3초
뮤즈-3B256×2560.5초
뮤즈-3B512×5121.3초

Parti 및 기타 자동 회귀 모델과 달리 Muse는 병렬 디코딩을 활용합니다. 고품질 이미지를 생성하고 객체, 공간 관계, 자세, 카디널리티 등과 같은 시각적 개념을 인식하기 위해 이미 교육을 받은 LLM은 세분화된 수준에서 영어를 이해해야 합니다. Muse에서 인페인팅, 아웃페인팅 및 마스크 없는 편집을 지원하기 위해 모델을 뒤집을 필요가 없습니다.

Google Muse AI는 무엇이며 예제와 어떻게 작동합니까? Muse by Google의 기능을 알아보고 AI 세계를 탐험하세요.
이미지 제공(MUSE)

Google Muse AI 기능

Muse는 텍스트에서 이미지를 생성하고 변경하기 위한 빠르고 최첨단 모델이며 다음과 같은 몇 가지 유용한 기능이 있습니다.

  • 텍스트를 이미지로 생성
    • 텍스트 입력에 대한 반응으로 Google의 인공 지능(AI) Muse는 고품질 시각 자료를 신속하게 생성합니다(TPUv4에서 512×512 해상도의 경우 1.3초 또는 256×256 해상도의 경우 0.5초).
Google Muse AI는 무엇이며 예제와 어떻게 작동합니까? Muse by Google의 기능을 알아보고 AI 세계를 탐험하세요.
이미지 제공(MUSE): 체스 게임을 하는 고양이. 하이퍼 샤프. 수상 경력. 캐논 카메라. 10mm 렌즈
  • 제로샷, 마스크 없는 편집
    • Google Muse AI 모델은 텍스트 지침에 대한 응답으로 이미지 토큰을 반복적으로 샘플링하여 무료로 제로샷, 마스크 없는 편집을 제공합니다.
  제품 이미지 생성의 미래: 전자 상거래 형성에서 Wondershare VirtuLook의 역할
Google Muse AI는 무엇이며 예제와 어떻게 작동합니까? Muse by Google의 기능을 알아보고 AI 세계를 탐험하세요.
이미지 제공(MUSE)
  • 이미지를 변경할 때 마스크 없는 편집을 통해 간단한 텍스트 프롬프트로 여러 개체를 조작할 수 있습니다.
Google Muse AI는 무엇이며 예제와 어떻게 작동합니까? Muse by Google의 기능을 알아보고 AI 세계를 탐험하세요.
이미지 제공(MUSE)
  • 제로샷 인페인팅/아웃페인팅
    • Google의 Muse AI는 무료이며 마스크 기반 편집 기능(인페인팅 및 아웃페인팅)이 함께 제공됩니다. 편집에 마스크를 적용하면 새로운 세대와 기능적으로 동일해집니다.
Google Muse AI는 무엇이며 예제와 어떻게 작동합니까? Muse by Google의 기능을 알아보고 AI 세계를 탐험하세요.
이미지 제공(MUSE)

Elon Musk처럼 트윗하는 데 도움이 되는 최고의 AI 트윗 생성기를 확인하십시오.

Google Muse AI 모델 세부정보

아래에서 Google의 Muse AI의 학습 흐름을 확인할 수 있습니다.

Google Muse AI는 무엇이며 예제와 어떻게 작동합니까? Muse by Google의 기능을 알아보고 AI 세계를 탐험하세요.
이미지 제공(MUSE)

Google 팀에서는 두 가지 VQGAN 토크나이저 네트워크를 사용하는데, 하나는 저화질 사진용이고 다른 하나는 고해상도 이미지용입니다. 저해상도(“base”) 및 고해상도(“superres”) 변환기는 마스킹되지 않은 토큰과 T5 텍스트 임베딩으로 훈련되어 마스킹된 토큰을 예측합니다.

Google Muse AI에 대한 자세한 내용을 보려면 여기를 클릭하십시오.

우리가 설명한 AI 도구

어떤 사람들은 “AI가 생성한 이미지에 반대한다”고 말하지만, 거의 매일 다음과 같은 새로운 AI 도구가 우리 삶에 들어옵니다.

  • 침착한 AI
  • 선인장 AI
  • OpenAI 포인트-E
  • 우버덕 AI
  • QQ 차원이 다른 나
  • MyHeritage AI 타임머신
  • 메타의 Cicero AI
  • 노션 AI
  • 메타 갤럭티카 AI
  • NovelAI
  • Make-A-Video 메타 AI
  • 달이 2
  • 웜보 드림
  • 구글 드림부스 AI
  • 안정적인 확산
  린 마케팅이란 무엇이며 장점은 무엇입니까?

더 많은 것을 기대해 주세요!

 

Source: Google Muse AI: 기능, 예 등