최근 Emad Mostaque가 설립하고 자금을 지원하는 회사인 Stability.ai는 AI가 만든 예술 작품의 공개 출시를 발표했습니다.
예술 분야의 AI에 대한 또 다른 시도라고 생각할 수도 있지만 실제로는 그 이상입니다. 두 가지 이유가 있습니다. 첫째, DALL-E 2와 달리 Stable Diffusion은 오픈 소스입니다. 이는 누구나 백본을 활용하여 특정 텍스트-이미지 생성 작업을 위한 애플리케이션을 무료로 구축할 수 있음을 의미합니다. 또한 Midjourney 개발자는 사용자가 Stable Diffusion과 결합할 수 있는 기능을 구현하여 놀라운 결과를 얻었습니다.
앞으로 몇 달 안에 무슨 일이 일어날지 상상해 보세요. 둘째, DALL-E mini 및 Disco Diffusion과 달리 Stable Diffusion은 OpenAI나 Google 모델을 부러워할 만큼 놀랍도록 현실적이고 예술적인 작품을 만들 수 있습니다. 사람들은 이것이 "생성 검색 엔진" 중 새로운 SOTA라고 주장하기도 합니다. (달리 명시하지 않는 한 이 기사의 모든 이미지는 Stable Diffusion을 사용하여 생성되었습니다.)
Stable Diffusion은 AI 아트 세계의 최고의 기능을 구현합니다. 이는 틀림없이 최고의 AI 아트 모델이며 오픈 소스입니다. 이것은 전혀 들어본 적이 없는 일이며 엄청난 영향을 미칠 것입니다. 더욱 흥미로운 점은 이러한 서비스에 대한 소식이 가장 예상치 못한 소스를 통해 귀하에게 전달될 수 있다는 것입니다. 부모님, 자녀, 파트너, 친구 또는 동료. 이러한 사람들은 인공 지능 분야에서 일어나는 일에 대해 외부인인 경우가 많으며, 이 분야의 최신 동향을 곧 발견하려고 합니다. 예술은 AI가 마침내 미래에 눈이 먼 사람들의 문을 두드리는 방식일 수 있습니다. 이것은 매우 시적이지 않습니까?
이것이 최고의 시스템(GPT-3 및 DALL-E 2)의 비밀을 질투심으로 지키는 OpenAI나 자체 시스템을 만들 계획조차 없는 Google(PaLM)과 같은 다른 기술 회사와 다른 점입니다. , LaMDA, Imagen 또는 Parti)가 비공개 베타로 출시되었습니다. Stability.ai의 이번 공개 릴리스는 모델 가중치와 코드를 공유하는 것 이상입니다. 이는 과학과 기술의 건전성에 중요하지만 대부분의 사람들이 관심을 두지 않는 것입니다. 또한 코딩을 원하지 않거나 코딩하는 방법을 모르는 사람들을 위해 코드가 없고 바로 사용할 수 있는 웹사이트를 제공합니다.
DreamStudio Lite라는 웹사이트는 무료로 사용할 수 있으며 최대 200장의 사진을 생성할 수 있습니다. DALL-E 2와 마찬가지로 유료 구독 모델이 있어 £10에 1,000개의 이미지를 얻을 수 있습니다(OpenAI는 한 달에 15크레딧으로 리필되지만 더 많은 크레딧을 얻으려면 15달러에 115팩을 구입해야 합니다). DALL-E의 비용은 이미지당 US$0.03이고, Stable Diffusion의 비용은 이미지당 £0.01입니다. 또한 Stable Diffusion은 API를 통해 규모에 맞게 사용할 수 있습니다(비용은 선형적으로 증가하므로 £1000로 100,000세대를 얻을 수 있습니다). 이미지 생성 외에도 Stability.ai는 곧 DreamStudio Pro(오디오/비디오) 및 Enterprise(스튜디오)를 발표할 예정입니다. DreamStudio가 곧 구현할 또 다른 기능은 일반적인 텍스트-이미지 설정 대신 다른 이미지에서 이미지를 생성하는 기능입니다. 이렇게:
웹사이트에는 프롬프트 엔지니어링에 대한 리소스도 있는데, 이 분야를 처음 접하는 경우 유용할 수 있습니다. 또한 DALL-E 2와 달리 매개변수를 제어하여 결과에 영향을 미치고 더 많은 주체를 유지할 수 있습니다. Stability.ai는 모델에 대한 액세스를 용이하게 하기 위해 모든 작업을 수행했습니다. OpenAI는 최초였으며 모델에 내재된 잠재적인 위험과 편향을 평가하기 위해 더 느리게 진행해야 했지만 모델을 오랫동안 비공개 베타 버전으로 유지하거나 창의성을 제한하는 비즈니스 모델을 구축할 필요는 없었습니다. Midjourney와 Stable Diffusion이 이를 입증했습니다.
오픈 소스 기술에는 고유한 한계가 있습니다. 개방성은 개인 정보 보호와 엄격한 통제보다 먼저 와야 하지만 보안보다 먼저 와서는 안 됩니다. 회사가 발표에서 설명했듯이 이는 모델의 공개적이고 책임감 있는 다운스트림 사용에 초점을 맞춘 "상업적 및 비상업적 사용을 모두 허용하는 라이센스"입니다. 또한 파생 저작물에도 최소한 동일한 사용자 기반 제한이 적용되도록 규정하고 있습니다.
오픈 소스 모델은 그 자체로 좋은 모델이지만, 이 기술이 결국 사람들에게 해를 끼치거나 잘못된 정보의 형태로 인터넷에 더 많은 오만을 추가하는 것을 원하지 않는다면 합리적인 가드레일을 구축하는 것도 마찬가지로 중요합니다. “이러한 모델은 인터넷에서 스크랩한 광범위한 이미지-텍스트 쌍에 대해 훈련되었기 때문에 모델은 일부 사회적 편견을 재현하고 안전하지 않은 콘텐츠를 생성할 수 있으므로 이러한 편견에 대한 공개 완화 전략과 공개 토론을 통해 모든 사람이 이 캠페인의 일부가 될 수 있습니다. 어쨌든 개방성 + 보안 > 개인 정보 보호 및 통제입니다.
Stable Diffusion은 윤리적 가치와 개방성의 탄탄한 기반을 바탕으로 실제 영향에서 경쟁사보다 뛰어난 성능을 발휘할 것을 약속합니다.
다운로드하여 PC에서 실행하려는 경우 6.9Gb의 VRAM이 필요하다는 점을 알아야 합니다. 이는 고급 소비자급 GPU에 적합하므로 DALL-E 2보다 가볍지만 아직 대부분의 사용자가 접근할 수 없습니다. 나처럼 다른 사람들도 바로 Dream Studio를 사용할 수 있습니다.
Stable Diffusion은 현재 사용 가능한 최고의 AI 아트 모델로 널리 알려져 있으며 수많은 애플리케이션, 네트워크 및 서비스의 기반이 되어 우리가 예술을 만들고 상호 작용하는 방식을 재정의할 것입니다. 하지만 이제는 다양한 사용 사례에 맞게 특별히 설계된 앱이 처음부터 모든 사람이 사용할 수 있도록 구축될 것입니다. 사람들은 어린이 그림을 향상시키고, 외부 그림 + 내부 그림으로 콜라주 만들기, 잡지 표지 디자인, 만화 그리기, 변형 및 애니메이션 비디오 만들기, 이미지에서 이미지 생성 등을 하고 있습니다. 이러한 응용 프로그램 중 일부는 DALL-E 및 Midjourney에서 이미 가능하지만 Stable Diffusion은 현재의 창의적 혁명을 다음 단계로 끌어올릴 수 있습니다. 전 Tesla AI 디렉터이자 Li Feifei의 제자인 Andrej Karpathy의 말에 따르면 "예술 창작은 인간 + AI 협력의 새로운 시대에 들어섰습니다."
Stable Diffusion과 같은 AI 아트 모델에는 새로운 유형의 도구가 포함되어야 합니다. 우리가 살고 있는 새로운 현실에 대한 새로운 사고의 틀로 이해됩니다. 우리는 단순히 다른 시대에 대한 유추나 유사점을 끌어내면서 미래를 정확하게 설명하거나 예측할 수 있다고 기대할 수는 없습니다. 어떤 것들은 비슷할 것이고 어떤 것들은 그렇지 않을 것입니다. 우리는 다가오는 미래를 미지의 영역으로 다루어야 합니다.
Stable Diffusion의 공개는 인공지능 아트 모델 분야에서 역대 가장 중요하고 영향력 있는 행사임에는 의심의 여지가 없으며 이는 단지 시작에 불과합니다.
저자 중 한 명인 Emad Mostaque는 트위터에서 다음과 같이 말했습니다. "더 빠르고, 더 좋고, 더 구체적인 모델을 출시함에 따라 품질이 전반적으로 계속해서 향상될 것으로 기대합니다. 이미지뿐만 아니라 다음 달에는 오디오, 3D, 비디오로 전환합니다. 언어, 코드 및 기타 교육
.우리는 예술과 창의성 전반을 상호 작용하고, 연결하고, 이해하는 방식에서 다년간의 혁명을 앞두고 있습니다. 그리고 철학적, 지적 영역뿐만 아니라 이제 모든 사람이 공유하고 경험하는 것입니다. 창조적인 세계는 영원히 변할 것입니다. 우리는 모두를 위한 더 나은 미래를 만들기 위해 개방적이고 존중하는 대화를 나누어야 합니다. 오픈소스 기술을 책임감 있게 사용할 때만 우리가 원하는 변화를 만들 수 있습니다.
위 내용은 DALL·E 뿐만이 아닙니다! 이제 AI 화가들이 모델을 만들고 영상을 만들 수 있게 됐습니다. 앞으로 무슨 일이 일어날지 상상조차 할 수 없습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!