Stable Diffusion AI art generator라는 텍스트-이미지 머신 러닝 모델은 EleutherAI, LAION 및 StabilityAI와 협력하여 자연 언어로 된 설명에서 디지털 이미지를 생성하기 위해 개발되었습니다.
AI에 의한 예술 창작은 새로운 것이 아닙니다. 하지만 올해 출시된 DALL-E 2, Midjourney AI, Stable Diffusion과 같은 소프트웨어 덕분에 가장 숙련되지 않은 아티스트라도 텍스트 상자에 몇 단어만 입력하면 복잡하거나 추상적이거나 사실적인 작품을 만들 수 있습니다.
Stability AI의 오픈 소스 사진 생성 모델은 품질 측면에서 DALL-E 2와 동등합니다. 또한 안정적인 확산 이미지 생성을 위한 컴퓨팅 시간을 제공하는 상용 웹사이트인 드림스튜디오(DreamStudio)를 소개했다. Stable Diffusion은 DALL-E 2와 달리 누구나 사용할 수 있으며 코드가 오픈 소스이기 때문에 프로젝트가 거의 제한 없이 빌드할 수 있습니다.
스테이블 디퓨전 AI 아트 제너레이터란?
스태빌리티 AI는 8월 22일 오픈소스 AI 아트 제너레이터인 스테이블 디퓨전(Stable Diffusion)을 출시했다. 스테이블 디퓨전(Stable Diffusion)을 생성하기 위해 Python을 사용하고, 트랜스포머 언어 개념을 사용한다. Cuda 커널을 지원하는 모든 운영 체제에서 사용할 수 있습니다.
오픈 소스 Stable Diffusion 이미지 합성 패러다임 덕분에 PC와 우수한 GPU만 있으면 누구나 상상할 수 있는 거의 모든 시각적 현실을 구축할 수 있습니다. 설명 텍스트를 제공하면 거의 모든 시각적 스타일을 복제할 수 있으며 결과는 화면에 기적적으로 나타납니다.
DALL-E와 같은 방법과 달리 Stable Diffusion은 소스 코드를 사용할 수 있도록 합니다. 라이센스는 일부 위험한 사용 상황을 금지합니다.
AI 윤리는 “딥페이크”를 만드는 데 모델을 사용할 수 있다고 주장하고 아티스트의 동의 없이 저작권이 있는 콘텐츠가 포함된 데이터 세트에서 훈련된 모델을 사용하여 이미지를 만드는 것이 적절한지 질문하는 반대자들로부터 공격을 받았습니다.
Stable Diffusion을 위한 훈련 세트는 LAION-Aesthetics V2 데이터 세트의 하위 집합이었습니다. $600,000에 쇼핑 모드에서 256개의 Nvidia A100 GPU로 훈련되었습니다.
Stable Diffusion을 뒷받침하는 회사인 Stability AI는 2022년 9월 기준으로 최대 10억 달러의 가치를 지닌 자본을 찾기 위해 논의 중입니다.
안정적인 확산 다운로드 요구 사항
2022년에는 일반적인 게임용 PC가 Stable Diffusion을 지원하지만 휴대폰과 대부분의 노트북은 지원하지 않을 것입니다. 충족해야 하는 Stable Diffusion 다운로드의 전제 조건은 다음과 같습니다.
- 에 있는 GPU 최소 6GB의 VRAM
- 여기에는 대부분의 최신 NVIDIA GPU가 포함됩니다.
- 하드 드라이브 또는 솔리드 스테이트 드라이브의 10GB(ish) 저장 공간
- Miniconda3 설치 프로그램
- GitHub의 안정적인 확산 파일
- 최신 체크포인트(작성 당시 버전 1.4, 1.5는 곧 출시될 예정)
- Git 설치 프로그램
- Windows 8, 10 또는 11
- 안정적인 확산은 Linux 및 macOS에서도 실행할 수 있습니다.
Stable Diffusion AI 아트 생성기는 얼마나 큽니까?
하드 디스크 또는 솔리드 스테이트 드라이브에 약 10GB의 저장 공간이 필요합니다.
필요한 하드웨어가 없는 경우 Midjourney AI 또는 기타 웹 기반 AI 생성기를 활용할 수 있습니다.
Stable Diffusion AI 아트 제너레이터를 실행하는 방법은 무엇입니까?
다음은 Stable Diffusion AI 아트 제너레이터를 실행하는 방법의 단계입니다.
- 힘내 설치
- Miniconda3 설치
- Stable Diffusion GitHub 리포지토리 및 최신 체크포인트 다운로드
어떻게 할 수 있는지 자세히 살펴보겠습니다.
힘내 설치
프로그래머는 Git이라는 기술을 사용하여 개발 중인 소프트웨어의 여러 버전을 관리할 수 있습니다. 다른 개발자가 프로젝트에 기여할 수 있도록 하면서 공유 저장소에 작업 중인 소프트웨어의 다른 버전을 유지할 수 있습니다.
개발자가 아닌 경우 Git은 이러한 프로젝트에 액세스하고 다운로드할 수 있는 간단한 방법을 제공합니다. 이 상황에서 적용해보겠습니다. Git을 설치하려면 Git 웹사이트에서 다운로드할 수 있는 Windows x64 설치 프로그램을 실행해야 합니다.
설치가 실행되는 동안 여러 옵션을 설정할 수 있는 옵션이 제공됩니다. 모두 기본 설정으로 두십시오. “PATH 환경 조정” 옵션 페이지를 방문하는 것이 중요합니다. “Git From the Command Line And Also 3rd-Party Software”만 선택해야 합니다.
Miniconda3 설치
Stable Diffusion은 다양한 Python 라이브러리를 사용합니다. Python에 익숙하지 않더라도 이에 대해 너무 걱정하지 마십시오. 라이브러리는 컴퓨터가 이미지 편집이나 어려운 산술 수행과 같은 특정 작업을 수행하는 데 사용할 수 있는 소프트웨어 패키지라는 것을 이해하는 것으로 충분합니다.
Miniconda3는 본질적으로 편리한 도구입니다. Stable Diffusion이 지루한 작업 없이 작동하는 데 필요한 모든 라이브러리를 관리할 수 있습니다. 또한 실제 시나리오에서 안정적인 확산을 사용하는 방법에도 영향을 미칩니다.
Miniconda3 다운로드 페이지를 방문하여 “Miniconda3 Windows 64-bit”를 선택하여 최신 버전을 다운로드하십시오.
다운로드 후 실행 파일을 두 번 클릭하면 설치가 시작됩니다. Git에 비해 Miniconda3 설치는 페이지 클릭이 더 적습니다. 그러나 이 결정을 내릴 때 주의해야 합니다.
다음 버튼을 누르고 설치를 완료하기 전에 “모든 사용자”가 선택되었는지 확인하십시오.
Miniconda3 및 Git을 설치한 후 컴퓨터를 다시 시작하라는 메시지가 표시됩니다.
Stable Diffusion GitHub 리포지토리 및 최신 체크포인트 다운로드
필요한 소프트웨어를 설치한 후 Stable Diffusion을 다운로드하여 설정할 수 있습니다.
최신 체크포인트를 먼저 다운로드해야 합니다. 체크포인트를 다운로드하려면 먼저 계정을 만들어야 하지만 필요한 것은 이름과 이메일 주소뿐입니다.
“라고 적힌 링크sd-v1-4.ckpt“를 클릭하면 다운로드가 시작됩니다. 다른 파일인 “sd-v1-4-full-ema.ckpt”는 거의 두 배나 더 크지만 더 나은 결과를 얻을 수 있습니다. 둘 중 하나를 사용할 수 있습니다.
다음 단계는 GitHub에서 Stable Diffusion을 얻는 것입니다. 녹색 “코드” 버튼을 선택한 다음 “ZIP 다운로드”를 클릭합니다. 이 직접 다운로드 링크를 사용할 수도 있습니다.
이제 Stable Diffusion용 파일의 압축을 풀었으므로 압축을 풀 디렉토리를 몇 개 생성해야 합니다. 시작 버튼을 클릭하고 시작 메뉴 검색 상자에 “miniconda3″를 입력한 다음, “열기” 또는 “Enter”를 선택합니다.
명령줄을 사용하여 “stable-diffusion”이라는 폴더를 만듭니다. 다음 코드 섹션을 Miniconda3 상자에 붙여넣은 후 Enter 키를 누릅니다.
모든 것이 계획대로 진행되면 Miniconda3 창이 나타납니다. 곧 다시 필요하므로 Miniconda3를 열어 두십시오.
선호하는 파일 아카이버를 사용하여 GitHub에서 다운로드한 “stable-diffusion-main.zip” ZIP 아카이브를 엽니다. Windows는 ZIP 파일이 없는 경우 대안으로 자체적으로 열 수 있습니다. 첫 번째 파일 탐색기 창에서 ZIP 파일을 열어 둔 상태에서 두 번째 창을 열고 방금 만든 “C:stable-diffusion” 폴더로 이동합니다.
ZIP 아카이브에서 “stable-diffusion-main” 폴더를 “stable-diffusion” 폴더로 끌어다 놓습니다.
Miniconda3로 돌아가서 창에 다음 명령을 붙여넣습니다.
cd C:stable-diffusionstable-diffusion-main conda env create -f environment.yaml conda activate ldm mkdir modelsldmstable-diffusion-v1
절차를 계속 진행하십시오. 일부 파일은 기가비트 이상이므로 다운로드하는 데 시간이 걸릴 수 있습니다. 실수로 프로세스를 중단한 경우 환경 폴더를 삭제하고 conda env create -f environment.yaml을 다시 시작해야 합니다. 이 시나리오에서는 “C:Users(Your User Account).condaenvs”에서 “ldm” 폴더를 지운 후 이전 명령을 실행합니다.
이제 설치의 마지막 단계가 완료되었습니다. 파일 탐색기를 이용하여 체크포인트 파일(sd-v1-4.ckpt)을 복사하여 “C:stable-diffusionstable-diffusion-mainmodelsldmstable-diffusion-v1” 폴더에 붙여넣습니다.
파일 전송이 완료된 후 “sd-v1-4.ckpt”를 마우스 오른쪽 버튼으로 클릭하고 컨텍스트 메뉴에서 “이름 바꾸기”를 선택합니다. 강조 표시된 필드에 “model.ckpt”를 입력하고 Enter 키를 눌러 파일 이름을 변경합니다.
이제 끝났습니다. 이제 안정적인 확산을 사용할 수 있습니다. 그러나 어떻게?
스테이블 디퓨전 가이드: 스테이블 디퓨전 AI 아트 제너레이터는 어떻게 사용하나요?
안정적인 확산은 어떻게 작동합니까? Stable Diffusion AI 아트 생성기를 가장 잘 사용하려면 다음 단계를 따르십시오.
- ldm 환경 활성화
- 디렉토리 변경
- txt2img.py를 사용하고 텍스트를 작성하십시오.
- 프로세스를 기다립니다
- 결과 확인
안정적인 확산을 사용하고 싶을 때마다 우리가 설계한 ldm 환경을 활성화해야 합니다. Miniconda3 창에 conda activate ldm을 입력하고 “Enter”를 누르십시오. 활성 ldm 환경은 왼쪽에 (ldm)으로 표시됩니다.
사진을 만들기 전에 먼저 디렉토리(따라서 commandcd)를 “C:stable-diffusionstable-diffusion-main”으로 변경해야 합니다. cd C:stable-diffusionstable-diffusion-main 명령줄 매개변수를 추가합니다.
txt2img.py라는 도구를 사용하여 텍스트 프롬프트를 512512 비주얼로 변환합니다.
사진이 생성되면 본체에 진행률 표시줄이 표시됩니다.
“C:stable-diffusionstable-diffusion-mainoutputstxt2img-samplessamples“는 제작된 모든 이미지의 위치입니다.
안정적인 확산 예 및 프롬프트
다음은 Stable Diffusion AI 아트 생성기 및 해당 프롬프트의 가장 좋은 예입니다.
즉각적인: 도미닉 메이어의 숲 방랑자, 앤서니 존스, 로이시, 제랄드 파렐의 회화적 스타일, 크레이그 멀린스, 마크 시모네티, 마이크 미뇰라, 평면 색상 일러스트레이션, 밝고 다채로운, 고대비, 신화, 영화 같은, 상세한, 대기의, 서사시, 컨셉 아트, 무광택 페인팅, 반지의 제왕, 왕좌의 게임, 조명 샤프트, 안개, 포토리얼리스틱, 컨셉 아트, 체적 조명, 시네마틱 서사시 + 3분의 1의 법칙 | 35mm| 옥탄 렌더, 8k, 코로나 렌더, 영화 컨셉 아트, 옥탄 렌더, 8k, 코로나 렌더, 시네마틱, artstation에서 트렌딩, 영화 컨셉 아트, 영화 구성, 울트라 디테일, 사실적, 히피리얼리즘, 체적 조명, 8k –ar 3:1 – 테스트 – 업라이트
즉각적인: 월드 오브 워크래프트의 환경 성 나스리아 :: 고딕 양식의 완전히 개발된 성 : 시네마틱, 비, 야간, 디테일, 서사시, 컨셉 아트, 무광택 페인팅, 조명 샤프트, 안개, 포토리얼리스틱, 컨셉 아트, 체적 조명, 시네마틱 서사시 + 규칙 3분의 1, 영화 컨셉 아트, 8k, 시네마틱, artstation에서 인기 급상승, 영화 컨셉 아트, 시네마틱 구성, 초상세, 현실감, 초현실적, 체적 조명, 8k –ar 3:1
즉각적인: 스파이더맨과 배트맨 사이의 슈퍼히어로 컨셉의 명확한 초상화, 코티지코어!!, 배경 하이퍼 디테일, 캐릭터 컨셉, 전신, 다이내믹 포즈, 복잡한, 매우 디테일, 디지털 페인팅, 아트 스테이션, 컨셉 아트, 부드럽고 날카로운 초점, 일러스트레이션, 아트 artgerm과 greg rutkowski와 알폰스 무야
렉시카 아트란?
Lexica는 Stable Diffusion으로 만든 예술 갤러리 및 검색 엔진입니다.
안정적인 보급을 통해 AI가 생성한 이미지를 활용한 검색엔진 사이트 렉시카(Lexica)에서 확인할 수 있다. Lexica에는 자동으로 생성된 이미지에 대한 프롬프트가 포함되어 있습니다.
스테이블 디퓨전은 오픈 소스인가요?
예. 지난 8월 22일 공개된 스테이블 디퓨전(Stable Diffusion)에 사용된 이미지는 인터넷에서 검색한 수백만 개의 이미지로 훈련된 신경망에 의해 생성됐다.
최근 DALL-E와 Midjourney AI의 새로운 라이벌이 등장했습니다. 무엇보다 무료입니다! AI 아트 생성기 충돌이 사물에 어떤 영향을 미치는지 살펴보겠습니다.
Source: 안정적인 확산 AI 아트 생성기: 프롬프트, 예제 및 실행 방법