Midjourney v5 출시 이후 생성된 이미지의 문자 및 손가락 디테일의 현실감이 크게 향상되었으며 신속한 이해의 정확성, 미적 다양성 및 언어 이해에서도 진전이 이루어졌습니다.
반면 Stable Diffusion은 무료이며 오픈 소스이지만 매번 긴 프롬프트 목록을 작성해야 하며 고품질 이미지 생성은 여러 번 드로잉 카드에 따라 달라집니다.
최근 Stability AI는 개발 중인 Stable Diffusion XL이 대중을 대상으로 테스트를 시작했으며 현재 Clipdrop 플랫폼에서 무료 평가판을 사용할 수 있다고 공식 발표했습니다.
평가판 링크: https://clipdrop.co/stable-diffusion
Stability AI 창립자이자 CEO인 Emad Mostaque는 이 모델이 아직 훈련 단계에 있다고 말했습니다. 매개변수가 안정된 후 오픈 소스로 제공되며 SD-XL은 "악수"와 같은 이미지 세부 사항에서 더 나은 성능을 발휘하며 거의 완벽하게 제어할 수 있습니다.
Stable Diffusion XL은 최종 출시 버전의 이름도 아니고 v3도 아닙니다. SD-XL의 아키텍처가 SD-v2 시리즈의 모델 아키텍처와 매우 유사하기 때문입니다. ㅋㅋㅋ 홈짐, 고무바닥, 벽걸이형 TV, 웨이트벤치, 메디신볼, 덤벨, 요가매트, 첨단장비, 하이디테일, 정리정돈 및 효율성
SD-XL에서 공식 공개한 다음 예시 사진은 be 화질이 매우 인상적이라는 것을 알 수 있습니다.
때때로 일부 네티즌들은 SD-XL이 "나쁜 취향"을 없애기 위해 너무 많은 규칙을 설정했다고 생각합니다. 커스터마이징을 위한 공간은 점점 작아지고 있으며 대부분의 사람들의 선호도를 충족시키지 못합니다. 현재 v1.5인 Stable Diffusion은 여전히 커뮤니티에서 가장 인기 있는 기본 모델입니다.
네티즌들은 SD의 새 버전이 SD 2.1 버전의 임베딩, 하이퍼네트워크 및 Lora 모델과 계속 호환될 수 있기를 희망했습니다. 처음부터 다시 교육하기에는 너무 불편할 것입니다.일부 네티즌들은 SD-XL의 성능이 네티즌들이 시빗 홈페이지에서 공유한 모델과 유사하다고 생각하고 있으며, 새 모델의 효과는 특별히 놀랍지 않아 평균 수준입니다.
SD-v2.1에는 9억 개의 매개변수가 포함되어 있고, SD-XL에는 약 23억 개의 매개변수가 포함되어 있으며, Emad는 공식 버전이 더 작은 증류 버전을 추가로 출시할 수도 있다고 말했습니다.
SD-XL은 이전 버전에 비해 다음과 같은 개선 사항이 있습니다.
더 짧은 설명 프롬프트를 사용하여 고품질 이미지 생성
명확하고 읽기 쉬운 텍스트
SD-XL에서 생성된 텍스트 정보가 항상 정확하지는 않지만 상당한 개선을 제공합니다.
"Menu"라고 적힌 메뉴를 들고 있는 식당에 앉아 있는 여성의 사진
라는 표지판을 들고 있는 남자의 사진 “라고 말한다 안정확산”
"안정확산"이라고 적힌 팻말을 들고 있는 젊은 여성, 머리카락에 하이라이트, 식당 밖에 앉아 있음, 갈색 눈, 드레스를 입고, 측면 조명
Liang, 밖에 앉아 있음 레스토랑, 갈색 눈, 치마 착용, 측면 조명
더 나은 인체 구조
안정적인 확산은 인체 해부학을 생성하는 데 항상 많은 문제가 있었으며, 다리가 많고, 팔이 적다는 것은 매우 일반적인 문제이며 일반적으로 이미지 세부 사항을 추가로 수정하기 위해 inpaint 기능을 사용하거나 ControlNet의 Open Pose 기능을 사용하여 참조 이미지에서 인체의 자세를 복사하는 데 필요합니다.예를 들어 SD-v1.5가 요가 이미지를 생성하면 왜곡된 인체가 자주 등장합니다.
요가 복장, 삼각형 자세, 저녁 해변, 림 조명을 입은 여성의 사진
SD-XL로 생성된 이미지는 완벽하지는 않지만 인간의 자세에 있어서 상당한 발전을 이루었습니다.
예를 들어, 집이라는 동일한 테마로 SD-XL은 더 대칭적이고 더 나은 시각 효과를 갖는 사진을 생성할 수 있습니다.
SD-XL은 인물 사진에서도 상당한 개선이 이루어졌습니다.
여성의 사진
프롬프트에 더 잘 맞는 이미지
예를 들어 이중톤(2색)을 예로 들면 SD-v1.5는 흑백 이미지만 생성하는 반면 SD-XL은 여러 색상의 이중톤 이미지를 생성할 수 있습니다.
v1 모델에 비해 프롬프트 이해 능력이 향상되었습니다.
duotone Portrait of a Woman
Duotone Portrait of a Woman
SD-XL은 동일한 v2 시리즈 모델에 속하기 때문에 텍스트 모델 크기가 더 크고 더 클 수 있습니다. v1 모델과 비교하여 프롬프트 단어를 더 잘 이해합니다.
예를 들어 아래 예에서 v1.5 모델은 이미지의 두 피사체(로봇과 인간)를 결코 이해할 수 없지만 SD-XL 모델은 일반 이미지를 생성할 수 있습니다(로봇은 아직 충분히 크지 않습니다.)
인간 옆에 앉아 있는 큰 로봇 친구, 껍데기 스타일의 유령, 애니메이션 배경화면
인간 옆에 앉아 있는 큰 로봇 친구, 껍데기 스타일의 유령, 애니메이션 배경화면
젊은 남자, 하이라이트 머리, 갈색 눈, 흰 셔츠와 청바지를 입고 화산을 배경으로 해변에서
젊은 남자, 하이라이트 머리, 갈색 눈, 화산을 배경으로 해변에 있는 흰색 셔츠와 청바지 화산을 배경으로 해변에 서 있는 흰색 셔츠와 청바지
아트 스타일
예를 들어, 두 모델은 서로 다른 각도에서 에드워드 호퍼 스타일의 이미지를 생성합니다.
Edward Hopper의 뉴욕시
Edward Hopper가 뉴욕을 그립니다
Leonid Afmov 스타일, SD-v1.5가 더 정확함, SD-XL에는 다양한 색상의 브러시가 없음 다채로운 보드 브러시 스트로크).
Leonid Afremov의 뉴욕시
Leonid Afemov
William-Adolphe Bouguereau 스타일로 그린 뉴욕, V1.5와 SDXL 모두 유사한 콘텐츠를 생성할 수 있습니다. 중 SD-XL은 Bouguereau가 만든 고전적인 학문적 그림에 더 가깝고 얼굴 세부 묘사가 더 많습니다. William-Adolphe Bouguereau의 아름다운 여인의 초상 관련 없는 키 추가 작성 후 모델의 스타일이 갑자기 바뀔 수 있습니다.
예를 들어 먼저 사진 스타일 이미지를 생성하세요.
젊은 남자, 하이라이트 머리, 갈색 눈, 흰 셔츠와 청바지를 입고 화산을 배경으로 해변에서
노란색 스카프를 추가하면 이미지 스타일이 만화가 됩니다 스타일.
젊은 남자, 하이라이트 머리, 갈색 눈,
노란색 스카프 착용,흰색 셔츠와 청바지를 입고 화산을 배경으로 해변에서
젊은 남자, 밝게 염색한 머리, 갈색 눈, 노란색 스카프 착용, 흰색 셔츠와 청바지 착용, 화산을 배경으로 한 해변에 서 있음
미공개 문제로 인한 오류일 수 있습니다. 정식 출시 전까지는 이 문제가 나중에 해결될 수 있을지 모르겠습니다.
위 내용은 Stable Diffusion-XL은 공개 베타 버전으로 공개되어 길고 번거로운 메시지가 표시되지 않습니다!의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!