Stability AI의 메인 텍스트 투 이미지 알고리즘의 가장 강력한 버전인 SDXL 1.0이 발표되었습니다. 더 적은 처리 리소스를 사용하고 0.9 버전보다 더 높은 해상도의 이미지를 생성하며 더 적은 텍스트 쿼리를 요청합니다. Stable Diffusion XL 1.0으로 더욱 유용하고 효율적입니다!
ChatGPT와 같은 인공 지능 도구는 단순히 텍스트를 생성하지 않습니다. 그들은 이제 음악, 영화 및 이미지를 포함한 다양한 미디어를 제작할 수 있습니다. 누구나 AI 프로그램인 Stable Diffusion으로 거의 모든 이미지를 만들 수 있습니다. 이미 널리 사용되고 있는 SD 및 유사 도구의 활용도는 업그레이드를 통해 상당히 개선될 것입니다.
“SDXL 1.0을 사용하면 모델을 맞춤형 데이터로 미세 조정하는 것이 그 어느 때보다 쉬워졌습니다. 데이터 랭글링의 필요성을 줄이면서 맞춤형 LoRA 또는 체크포인트를 생성할 수 있습니다. Stability AI 팀은 SDXL에 특화된 T2I/ControlNet을 사용하여 차세대 작업별 구조, 스타일 및 구성 컨트롤을 구축하고 있습니다. 이러한 기능은 현재 베타 미리 보기 상태이지만 미세 조정에 대한 업데이트를 계속 지켜봐 주시기 바랍니다.”라고 Stability AI가 발표했습니다.
SDXL 1.0 기능
이제 고객은 완전히 새로운 미세 조정 베타 기능 덕분에 불과 5개의 이미지로 특정 사람이나 사물을 생성하는 데 특화할 수 있습니다. 이 유틸리티는 적은 수의 사진을 사용하여 SDXL 1.0을 다듬습니다.
현재 시장에 나와 있는 가장 효과적인 오픈 액세스 이미지 모델 중 하나인 SDXL 1.0에는 66억 개의 매개변수 모델 앙상블 파이프라인과 35억 개의 매개변수 기본 모델이 있습니다. Stability.ai의 Clipdrop을 사용하여 모델을 무료로 사용해 볼 수 있습니다.
Stability AI의 새로운 기능으로 이미지 향상 SDXL 0.9
잠재 확산을 위한 완전한 모델은 다양한 전문가의 파이프라인입니다. 첫 번째 단계에서 기본 모델은 (노이즈가 있는) 환자를 생성한 다음 최종 노이즈 제거 단계를 위해 특별히 만들어진 정제 모델에 의해 추가로 처리됩니다. 기본 모델을 모듈로 독립적으로 사용할 수 있다는 점을 잊지 마십시오.
이 2단계 아키텍처는 속도 저하나 과도한 CPU 리소스 요구 없이 사진 생성의 탄력성을 가능하게 합니다. SDXL 1.0은 8GB VRAM 또는 널리 액세스할 수 있는 클라우드 인스턴스가 있는 소비자 GPU에서 효과적으로 작동해야 합니다.
“SDXL은 거의 모든 아트 스타일에서 고품질의 이미지를 생성하며 포토리얼리즘을 위한 최고의 개방형 모델입니다. 모델이 부여한 특별한 ‘느낌’ 없이 뚜렷한 이미지를 자극할 수 있어 스타일의 절대적인 자유를 보장합니다. SDXL 1.0은 특히 기본 1024×1024 해상도에서 이전 모델보다 더 나은 대비, 조명 및 그림자를 통해 생생하고 정확한 색상을 위해 잘 조정되었습니다.”라고 Stability AI가 블로그 게시물에서 말했습니다.
안정성 AI 출시 안정적인 낙서 스케치-이미지 생성을 가능하게 하는
다양한 플랫폼에서 SDXL 1.0을 사용하는 방법
이 모델은 Stability AI API, GitHub 페이지, Clipdrop 및 DreamStudio 소비자 애플리케이션을 통해 액세스할 수 있습니다. 사용자가 ML 솔루션, 모델 및 알고리즘을 얻을 수 있는 ML 허브인 Amazon SageMaker JumpStart에서도 찾을 수 있습니다.
SDXL 1.0 릴리스는 7월 연구용 SDXL 0.9 릴리스 이후에 출시되었습니다. 이 회사는 색상과 현란함에 더 충실한 색상과 향상된 대비, 조명 및 그림자를 생성하기 위해 모델을 변경했다고 합니다. 다양한 종횡비로 전체 1메가픽셀 해상도 이미지(1024 x 1024)를 더 빠르게 생성할 수 있도록 이미징 프로세스도 개선되었습니다.
Stable Diffusion XL 1.0을 사용하는 데 필요한 일부 링크는 다음과 같습니다. SDXL 1.0을 시작하려면 다음과 같은 다양한 플랫폼을 확인하십시오.
- 클립드롭
- GitHub
- 안정성 AI API
- AWS 세이지메이커
- AWS 기반암
- 안정적인 재단 불화
- 드림스튜디오
오픈 소스 특성으로 인해 SDXL은 Midjourney보다 훨씬 더 많은 기능과 잠재력을 가지고 있지만 효과적으로 사용하려면 약간의 노력이 더 필요합니다. 아마도 품질 면에서 Midjourney의 품질 수준과 일치하는 상업적으로 이용 가능한 유일한 이미지 모델은 SDXL일 것입니다.
주요 이미지 크레딧: Stability AI
Source: 향상된 기능을 갖춘 SDXL 1.0이 출시되었습니다.