집 >기술 주변기기 >일체 포함 >5가지 최고의 오픈 소스 AI 이미지 생성기

5가지 최고의 오픈 소스 AI 이미지 생성기

王林원래의: 2024-06-14 20:28:00944검색

인터넷에는 특정 종류의 이미지를 전문으로 하는 수십 개의 무료 오픈 소스 AI 텍스트-이미지 생성기가 있습니다. 그래서 우리는 더미를 살펴보고 지금 당장 사용해 볼 수 있는 최고의 오픈 소스 AI 텍스트-이미지 생성기를 찾았습니다.

1 Craiyon

The 5 Best Open-Source AI Image Generators

Craiyon은 가장 쉽게 액세스할 수 있는 오픈 소스 AI 이미지 생성기 중 하나입니다. 이는 DALL-E Mini를 기반으로 하며 Github 저장소를 복제하고 컴퓨터에 로컬로 모델을 설치할 수 있지만 Craiyon은 웹 사이트를 선호하여 이 접근 방식을 중단한 것으로 보입니다.

공식 Github 저장소는 2022년 6월 이후로 업데이트되지 않았지만 공식 Craiyon 사이트에서는 여전히 최신 모델을 무료로 사용할 수 있습니다. Android 또는 iOS 앱도 없습니다.

기능 측면에서 AI 이미지 생성기에서 기대할 수 있는 일반적인 옵션이 모두 표시됩니다. 프롬프트를 입력하고 이미지를 얻은 후에는 고급 기능을 사용하여 더 높은 해상도의 사본을 얻을 수 있습니다. 아트, 사진, 드로잉의 세 가지 스타일 중에서 선택할 수 있습니다. 모델이 결정하도록 하려면 "없음" 옵션을 선택할 수도 있습니다.

또한 "전문가 모드"를 사용하면 모델에게 특정 항목을 피하도록 지시하는 부정적인 단어를 포함할 수 있습니다. ChatGPT를 사용하여 사용자가 가능한 가장 상세하고 최상의 프롬프트를 작성할 수 있도록 돕는 프롬프트 예측 기능도 있습니다. 마지막으로 AI 기반 배경 제거 기능을 사용하면 이미지에서 배경을 자르는 시간과 노력을 절약할 수 있습니다.

이것이 바로 Craiyon이 하는 모든 일입니다. 가장 정교한 AI 이미지 생성 모델은 아니지만, 디테일하거나 사실적인 것을 원하지 않는 경우 기본 모델로는 좋습니다.

모델은 무료로 사용할 수 있지만 무료 사용자는 1분 내에 한 번에 9개의 무료 이미지로 제한됩니다. Supporter 또는 Professional 계층(각각 월 5달러 및 20달러, 연간 청구)을 구독하면 광고나 워터마크가 없고 생성 속도가 빨라지며 생성된 이미지를 비공개로 유지하는 옵션을 얻을 수 있습니다. 사용자 정의 구독 계층에서는 사용자 정의 모델, 통합, 전용 지원 및 개인 서버도 허용됩니다.

2 Stable Diffusion 1.5

Stable Diffusion은 아마도 가장 인기 있는 오픈 소스 텍스트-이미지 생성 모델 중 하나일 것입니다. 또한 아래에 언급된 세 가지 이미지 생성기를 포함한 다른 모델에도 전원을 공급합니다. 2022년에 출시되었으며 그 이후로 많은 구현이 있었습니다.

모델 작동 방식에 대한 지나치게 기술적 세부 사항은 생략하겠습니다(공식 Github 저장소에서 확인할 수 있음). 하지만 이 모델은 완전 초보자라도 설치하기 쉽고 숙련된 한 잘 작동합니다. 최소 4GB 메모리를 갖춘 전용 GPU. 온라인으로 Stable Diffusion에 액세스할 수도 있으며, Mac에서 Stable Diffusion을 실행하려는 경우에도 저희가 도와드리겠습니다.

Stable Diffusion에 사용할 수 있는 여러 체크포인트(버전 고려)가 있습니다. 버전 1.5를 테스트하는 동안 버전 2.1도 활발하게 개발 중이며 더 정확합니다.

모델을 실행하는 것도 오히려 쉽습니다. AUTOMATIC1111 Stable Diffusion 웹 사용자 인터페이스로 테스트한 결과 모든 컨트롤과 매개변수가 잘 작동했습니다. 또한 모델이 훈련한 LAION-5B 데이터베이스 덕분에 NSFW를 완벽하게 방지할 수 있습니다(비록 완벽하지는 않지만 주의하세요). 생성 시간 자체는 하드웨어에 따라 다르지만 기본 프롬프트에서도 이미지가 상세하고 사실적일 것으로 기대할 수 있습니다.

3 DreamShaper

DreamShaper는 Stable Diffusion 기반의 이미지 생성 모델입니다. 이는 MidJourney의 오픈 소스 대안으로 의도되었으며 생성된 이미지의 사실적인 표현에 중점을 두었습니다. 단 몇 가지 조정을 통해 애니메이션 및 그림 스타일도 처리할 수 있습니다.

이 모델은 Stable Diffusion보다 성능이 뛰어나 사용자가 번개 개선부터 느슨한 NSFW 제한에 이르기까지 최종 출력에 대해 더 많은 자유를 누릴 수 있습니다. 로컬 액세스를 위해 온라인으로 다운로드할 수 있는 사전 훈련된 버전과 Sinkin.ai, RandomSeed 및 Mage.space(기본 구독 필요)를 포함한 다양한 웹사이트를 통해 모델을 실행하는 것도 쉽습니다. GPU 가속.

지금쯤 짐작할 수 있듯이 DreamShaper로 생성된 이미지는 Stable Diffusion에 비해 더 사실적으로 보이는 경향이 있습니다. 두 모델 모두에서 동일한 프롬프트를 실행하더라도 DreamShaper 모델은 더 현실적이고 상세하며 조명이 더 밝을 것입니다.

이는 초상화나 캐릭터의 경우 특히 그렇습니다. 동일한 프롬프트에 비해 안정적인 확산이 부족하다는 점을 발견했습니다. 이미지가 너무 사실적으로 변하는 경우 AI 생성 이미지를 식별하는 네 가지 방법이 있습니다.

모델을 실행하는 데 거대한 PC가 필요하지 않습니다. 4GB VRAM을 탑재한 내 GTX 1650Ti는 모델을 완벽하게 실행했습니다. 생성 시간이 조금 더 길어졌지만 실제 출력에는 영향을 미치지 않는 것 같습니다. 즉, Stable Diffusion XL 모델을 기반으로 하는 DreamShaper XL을 실행하려면 더 많은 VRAM이 있는 GPU가 필요할 수 있습니다.

4 InvokeAI

Invoke AI는 Stable Diffusion XL을 기반으로 한 XL 버전과 함께 Stable Diffusion을 기반으로 한 또 다른 AI 기반 이미지 생성 모델입니다. 또한 자체 웹 및 명령줄 사용자 인터페이스가 있으므로 Stable Diffusion 웹 UI와 같은 작업을 수행할 필요가 없습니다.

이 모델은 사용자가 맞춤형 워크플로를 통해 지적 재산을 기반으로 시각적 개체를 만들 수 있도록 하는 데 중점을 둡니다. InvokeAI는 사용자 정의 모델을 교육하고 지적 재산 작업을 위한 최고의 오픈 소스 AI 이미지 생성 모델 중 하나입니다.

공식 Github 저장소에는 두 가지 설치 방법이 나열되어 있습니다. InvokeAI 설치 프로그램을 통해 설치하거나, 터미널과 Python에 익숙하고 모델과 함께 설치된 패키지에 대해 더 많은 제어가 필요한 경우 PyPI를 사용하는 것입니다.

그러나 추가 제어에는 몇 가지 제한 사항이 있으며, 특히 하드웨어 요구 사항이 더욱 엄격해집니다. InvokeAI는 최소 4GB의 메모리를 갖춘 전용 GPU를 권장하며, XL 변형을 실행하려면 6~8GB가 권장됩니다. VRAM 요구 사항은 AMD 및 Nvidia GPU 모두에 적용됩니다. 또한 모델, 해당 종속성 및 Python을 위해 최소 12GB의 RAM과 12GB의 여유 디스크 공간이 필요합니다.

문서에서는 비디오 메모리 부족으로 인해 Nvidia의 GTX 10 시리즈 및 16 시리즈 GPU를 권장하지 않지만 제공된 설치 프로그램은 정상적으로 실행되었습니다. 마일리지는 다를 수 있지만 저가형 GPU를 사용하는 경우 메시지가 이미지로 변환되는 것을 보려면 더 오래 기다려야 합니다. 마지막으로, Windows를 사용하는 경우 현재 AMD GPU가 지원되지 않으므로 Nvidia GPU만 사용할 수 있습니다.

이미지 생성 부분에서는 모델이 사실주의보다는 예술적인 스타일에 더 치우치는 경향이 있습니다. 물론, 데이터세트를 사용하여 모델을 훈련하고 원하는 이미지에 더 가까운 이미지를 생성하도록 할 수 있습니다. 특히 제품 디자인, 건축 또는 소매 공간에서 작업하는 경우 사실적인 이미지가 포함된 경우에도 마찬가지입니다. 그러나 명심해야 할 한 가지 중요한 점은 InvokeAI가 기본적으로 이미지 생성 엔진이라는 것입니다. 즉, 최상의 결과를 얻으려면 자체 모델(웹 인터페이스에 제공되는 모델 관리자를 통해 쉽게 찾을 수 있음)을 기본값으로 사용해야 할 가능성이 높습니다. 모델은 Stable Diffusion 자체와 매우 유사합니다.

5 Openjourney

Openjourney는 Stable Diffusion을 기반으로 하는 무료 오픈 소스 AI 이미지 생성 모델입니다. 모델 이름이 Openjourney인 이유가 궁금하다면 Midjourney 이미지에 대해 훈련되었으며 생성된 이미지에서 해당 스타일을 모방할 수 있기 때문입니다.

Openjourney를 개발한 회사인 PromptHero를 사용하면 Stable Diffusion(버전 1.5 및 2), DreamShaper 및 Realistic Vision을 포함한 다른 모델과 함께 모델을 테스트할 수 있습니다. 가입 시 25개의 무료 크레딧(생성된 각 이미지당 1개의 크레딧)을 받게 되며, 그 후에는 Pro 구독 등급을 구독해야 합니다. Pro 구독 등급은 한 달에 9달러이며 다른 독점 기능과 함께 매월 300크레딧에 액세스할 수 있습니다.

하지만 로컬에서 무료로 실행하고 싶다면 HuggingFace에서 모델 파일을 다운로드한 후 Stable Diffusion 웹 UI를 사용하여 실행할 수 있습니다. Openjourney는 HuggingFace에서 Stable Diffusion 바로 다음으로 두 번째로 많이 다운로드된 AI 이미지 생성 모델이기도 합니다.

Openjourney는 웹 사이트에서 모델을 로컬로 실행하기 위한 특정 하드웨어 요구 사항을 나열하지 않지만 Stable Diffusion과 유사한 하드웨어 요구 사항을 기대할 수 있습니다. 이는 모델과 해당 종속성을 저장하기 위해 4GB VRAM, 16GB RAM 및 약 12~15GB의 컴퓨터 여유 공간을 갖춘 전용 GPU를 의미합니다.

Openjourney에서 생성된 이미지는 달리 명시되지 않는 한 사실주의와 예술 사이에서 균형을 이루는 경향이 있습니다. 만능 모델을 찾고 있고 구독 비용을 지불하지 않고 Midjourney 모양과 느낌을 선호한다면 Openjourney가 최고의 옵션 중 하나입니다.

위 내용은 5가지 최고의 오픈 소스 AI 이미지 생성기의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명：

이전 기사：VS Code를 위한 6가지 최고의 ChatGPT 확장다음 기사：VS Code를 위한 6가지 최고의 ChatGPT 확장