메타버스를 형성하는 것으로 알려진 거대 기술 기업 Meta는 최근 인공 지능의 놀라운 발전인 Emu AI(약어: Emu AI)를 공개했습니다. 표현 미디어 세계.

이 최첨단 AI 모델은 텍스트 설명에서 이미지를 생성하는 프로세스를 혁신합니다.

에뮤 AI
Emu AI는 텍스트 설명에서 이미지가 생성되는 방식을 완전히 변화시킬 수 있는 잠재력을 가지고 있습니다(이미지 출처)

Emu AI를 통한 품질 조정

Emu의 독창성의 핵심에는 다음과 같은 기술이 있습니다. “품질 튜닝.” 이 혁신적인 접근 방식은AI 텍스트-이미지 모델로 생성된 이미지의 시각적 매력입니다. 결과는 시각적으로 눈에 띌 뿐만 아니라 제공된 텍스트에 매우 충실합니다.

광범위한 연구 노력을 통해 Meta의 AI 팀은 다음과 같은 여정을 시작했습니다. 잠재 확산 모델의 사전 훈련. 이 초기 단계에는 11억 개의 이미지-텍스트 쌍으로 구성된 거대한 데이터세트입니다. 하지만, 진정한 돌파구는 미세 조정 단계에서 나타났습니다. 시스템이 훈련을 받은 곳 엄선된 고품질 이미지 2000개만 선별하여 제공합니다.

  그래미: 2023년 최고의 비디오 게임 사운드트랙

인간의 전문성과 기술의 결합

이 과정은 찾기로 설명됩니다. “건초더미 속의 포토제닉 바늘” 최첨단 기술과 필수적인 인간의 손길을 결합합니다. 초기 데이터세트는 수십억 개의 이미지를 캡처할 정도로 방대했습니다. 그래도 지나갔어 일련의 자동 필터 이 이미지의 보물이 세련되었다는 것입니다. 다음과 같은 요인 불쾌한 콘텐츠, 이미지-텍스트 정렬, 그리고 텍스트 오버레이 면밀히 조사되었습니다. 하지만 자동 필터링의 한계는 분명했고, 인간 주석자가 중요하게 포함됩니다.

일반 전문가부터 전문가까지 다양한 주석자가 참여했습니다. 중추적인 역할 선택 과정에서. 그들의 안목은 최고의 이미지, 즉 최고의 이미지만을 보장합니다. ‘좋은’ 달성하다 ‘특별한’ 상태 – 최종 컷을 작성했습니다. 결국, 이미지가 2000개 남짓 남았는데, 각각은 부인할 수 없는 매력을 가지고 있습니다.

에뮤 AI
독특하고 주목을 끄는 성격으로 유명한 새인 에뮤는 Emu AI라는 이름으로 영예를 얻었습니다(이미지 출처)

구별의 별명

이 획기적인 모델의 이름으로 ‘Emu’를 선택한 것은 상징적. 에게 경의를 표하는 것입니다. 독특하고 주목을 끄는 성격으로 유명한 새인 에뮤. 이 선택은 Emu의 능력을 반영합니다. 관심을 끌다 그리고 이미지 생성 영역에서 두각을 나타냅니다.

최첨단 기술에 대한 Emu AI의 승리

Emu AI의 능력은 사실적인 설정의 영역을 넘어 확장됩니다. 스케치와 만화를 생성합니다. 에 대한 비교 평가 최첨단 SDXL1.0 모델 놀라운 결과를 얻었습니다. Emu가 선호되는 선택으로 나타났습니다. 선호율 68.4%시각적 매력을 위해 PartiPrompts 벤치마크에서는 훨씬 더 인상적이었습니다. 선호율 71.3% 개방형 사용자 입력 벤치마크에서

  Snapchat에서 손쉽게 화면을 공유하는 방법

Meta의 연구자들은 Emu의 탁월한 성능이 모델 아키텍처뿐만 아니라 결정적으로 다음과 같은 요인에 기인한다고 생각합니다. 미세 조정에 사용되는 데이터의 품질과 다양성. 놀랍게도 그 영향은 100개의 고품질 훈련 이미지 Emu AI의 생성 능력은 상당했습니다. 이는 AI 창의성과 인간의 미학을 조화시키는 데 있어 엄선된 모범 사례 세트의 잠재력을 강조합니다.

에뮤의 다각적인 예술성

Emu의 가장 칭찬할 만한 특징 중 하나는 다양성입니다. 묘사하는 능력을 보여줍니다. 다양한 컨셉, 에 이르기까지 초상화 에게 광활한 풍경 그리고 심지어 추상미술도요. 이러한 다재다능함은 Emu를 다음을 위한 강력한 도구로 자리매김합니다. 예술가, 디자이너, 그리고 크리에이터 다양한 시각적 분야에 걸쳐 있습니다.

에뮤 AI
Emu AI는 아이디어를 시각적으로 매력적인 콘텐츠로 손쉽게 전환하는 AI를 만드는 Meta의 중요한 단계입니다(이미지 제공).

AI 기반 창의성의 미래를 개척하다

에뮤는 메타의 큰 도약 원활하게 수행할 수 있는 AI를 향해 아이디어를 시각적으로 매력적인 콘텐츠로 변환합니다. 이는 기계 학습 데이터세트의 세심한 큐레이션의 가치를 입증하는 역할을 합니다. 게다가, 텍스트만으로도 우리의 상상력이 풍부한 비전을 구체화하기에 충분할 수 있는 미래에 대한 감질나는 엿볼 수 있는 기회를 제공합니다.

  WhatsApp은 이미 24시간 이내에 사라지는 메시지를 테스트하고 있습니다.

Emu의 기능은 곧 Meta AI 챗봇을 통해 액세스할 수 있게 될 것입니다. 시각적으로 놀라운 콘텐츠 제작을 민주화하세요 수많은 애플리케이션과 장치에 걸쳐.

주요 이미지 출처: 메타

Source: Emu AI가 GenAI 경주에 합류했습니다.