확산 모델 기반 이미지 생성-일체 포함-php.cn

집

기술 주변기기

일체 포함

확산 모델 기반 이미지 생성

王林

Apr 14, 2023 pm 02:58 PM

Part 01 이 기사에서는 VAE와 같은 당시 생성 모델에는 큰 어려움이 있음을 제안했습니다. 즉, 이러한 유형의 모델은 먼저 조건부 분포를 정의한 다음 변형 사후를 정의하여 적응하게 됩니다. 조건부 분포와 사후 변이를 동시에 최적화해야 하는 경우가 있습니다. 데이터 분포를 표준 가우스에 매핑하는 간단한 프로세스를 정의할 수 있다면 "생성기"의 작업은 이 프로세스의 역 프로세스의 각 작은 단계를 간단히 맞추는 것이 됩니다. 이것이 확산 모델의 핵심 아이디어입니다. . 하지만 이 글은 당시 별다른 파장을 일으키지 않았다.

1.2 개발2020년에는 기존 아이디어를 바탕으로 DDPM 모델(Denoising Diffusion Probabilistic Models)을 제안했으며, 저자는 기본 확산 모델과 비교하여 확산 모델과 Denoising 점수 가이드를 제안했습니다. 생성된 이미지 샘플을 적절하게 개선하는 훈련 및 샘플링 프로세스를 통해 더 간단하고 안정적인 훈련 조건에서 최종 결과를 GAN 모델과 비교할 수 있습니다.

그림 2세대 DDPM 결과

그러나 DDPM 모델은 확산 과정이 마르코프 체인이기 때문에 상대적으로 많은 수를 필요로 한다는 단점이 있습니다. 이 방법을 통해서만 상대적으로 좋은 결과를 얻을 수 있으며 이로 인해 샘플 생성이 매우 느려집니다.

그래서 2021년 Song et al.은 DDPM 확산 과정의 샘플링 방법을 변형하고 비마코프 과정에 대한 전통적인 마르코프 확산 과정을 촉진하는 DDIM(Denoising Diffusioin Implicit Model)을 제안했습니다. , 더 작은 샘플링 단계를 사용하여 샘플 생성을 가속화하여 효율성을 크게 향상시킬 수 있습니다.

확산 모델 기반 이미지 생성

VAE와 DM 모델의 결합, GAN+DM의 결합 등과 같이 확산 모델을 기존 세대 네트워크와 통합하기 위한 후속 작업에도 몇 가지 개선 사항이 있습니다. 여기서 자세히 설명하지 마세요.

1.3 Outbreak

2022년 Google은 확산 모델을 기반으로 텍스트 설명을 사실적인 이미지로 변환할 수 있는 새로운 AI 시스템을 출시했습니다.

사진 3

사진 4 확산 모델 기반 이미지 생성

Google에서 제공한 회로도에서 볼 수 있듯이 입력된 text 먼저 인코딩한 후 text-to-image 확산 모델을 통해 64*64 작은 이미지로 변환합니다. 또한, 작은 이미지를 처리하기 위해 초해상도 확산 모델을 사용하며 이미지의 해상도는 다음과 같습니다. 추가적인 반복 과정을 거쳐 개선되어 최종 생성된 결과는 1024*1024 크기의 최종 이미지입니다. 이 마법의 과정은 모든 사람이 그것을 사용할 때 느끼는 것과 같습니다. 빨간색 점선 터틀넥과 파란색 체크무늬 모자를 쓴 골든 리트리버 강아지라는 텍스트를 입력하면 프로그램이 자동으로 위의 개 사진을 생성합니다. 본.

또 다른 인기 있는 현상 수준 애플리케이션인 novalAI는 원래 AI 글쓰기 전용 웹사이트였습니다. 현재 핫한 이미지 생성을 기반으로 인터넷의 사진 리소스와 결합하여 2차원 이미지 생성에 중점을 둔 웹사이트를 훈련했습니다. 모델은 효과면에서 인간 화가의 수준에 도달하기 시작했습니다.

확산 모델 기반 이미지 생성

그림 5

그림을 제작하기 위한 전통적인 텍스트 입력 외에도 AI가 참조할 수 있는 그림 입력도 지원합니다. 기존 사진을 기반으로 새로운 사진을 생성하면 AI가 생성한 결과를 통제할 수 없는 문제가 어느 정도 해결됩니다.

Part 02 ● 원리 설명 ●

그렇다면, 이렇게 강력한 AI 기술의 작동 과정은 어떻게 될까요? 여기서는 간단한 프로세스를 제공하기 위해 보다 고전적인 DDPM 모델을 예로 들어 보겠습니다.

2.1 순방향 프로세스

순방향 프로세스는 훈련 샘플을 구성할 목적으로 이미지에 노이즈를 추가하는 프로세스입니다. GT .

주어진 초기 데이터 분포 x0~q(x)에 대해 점차적으로 데이터 분포에 가우스 노이즈를 추가합니다. 이 프로세스는 T번이고 각 단계의 결과는 x1, x2,...입니다. xt 에서 노이즈의 표준편차는 으로 표현되며, 노이즈 추가 과정은 다음과 같이 표현될 수 있습니다. 체인 프로세스. 결국 데이터는 등방성 가우스 분포가 되는 경향이 있습니다.

2.2 역확산 과정 확산 모델 기반 이미지 생성

역 과정은 잡음 제거 과정입니다.

이면 완전한 표준 가우스 분포에서 x0을 복원할 수 있습니다.

는 가우스 분포를 만족하고

은 충분히 작습니다. 그러면 는 여전히 가우스 분포이고 확산 모델 기반 이미지 생성 은 단순히 추론할 수 없으므로 매개변수가 있는 딥 러닝 모델을 사용합니다 예측해 보세요:

확산 모델 기반 이미지 생성

x0을 알고 있으면 베이지안 공식을 사용합니다.

확산 모델 기반 이미지 생성

2.3 훈련 과정

머신러닝을 위한 경우 모든 모델 훈련은 모델의 매개변수를 최적화하여 신뢰할 수 있는 평균과 분산을 얻는 것임을 알아야 합니다. 즉,

확산 모델 기반 이미지 생성

후 일련의 파생을 통해 DDPM 모델은 최종 손실 함수 표현식을 얻었습니다.

받기 입력 x0, 1...T 확산 모델 기반 이미지 생성

2. 표준 가우스 분포에서 노이즈를 샘플링합니다

손실을 계산하고 반복적으로 최소화합니다. 기능
그림 6
파트 03

요약 확산 모델 기반 이미지 생성 ●

확산모델이 좋은 모습을 보여줬네요 VAE 모델과 비교하여 사후 분포를 정렬할 필요가 없으며 GAN과 같은 추가 판별자를 훈련할 필요도 없습니다. 음성 처리 및 기타 측면에 적용할 수 있습니다. 이는 AI가 조건에 따라 여러 그림을 생성할 수 있게 하고, 인간이 결과를 필터링하고 수정할 수 있도록 하여 생산 효율성을 크게 향상시킬 수 있는 2D 페인팅의 미래가 될 것입니다. 2D 디지털 자산.

그러나 AI 기술이 발전함에 따라 항상 논란은 존재하게 되는데, 이미지 생성 분야도 예외는 아니며, 생성된 이미지 구조가 잘못되거나 불합리한 등 AI 기술 자체의 문제도 예외는 아닙니다. AI 저작물 자체의 저작권 문제 등 법적 분쟁도 일부 존재한다. 기술적인 문제는 기술 자체의 발전을 통해 해결할 수 있습니다. AI 기술의 발전으로 이미지 생성이 결국 매우 높은 수준에 도달하여 대부분의 저가형 페인팅 관련 직업이 사라질 것이라고 믿을 만한 이유가 있습니다. 인간의 생산성을 크게 해방시킵니다. 저작권 문제로 인해 정부 부처는 관련 산업의 발전에 충분한 관심을 기울이고 관련 정책과 시스템을 개선해야 합니다. 이를 위해서는 AI 기술이 우리에게 더 나은 서비스를 제공할 수 있도록 신흥 분야에 대해 더 많이 생각해야 합니다.

참고자료

https://www.php.cn/link/3799b2e805a7fa8b076fc020574a73b2

https://www.php.cn/링크 /6872937617af85db5a39a5243e858d1f

https://www.php.cn/link/831da40e5907987235ebe5616446e083

위 내용은 확산 모델 기반 이미지 생성의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

이 기사는 51CTO.COM에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제

관련 기사

SQL 사례 문 : 기본에서 고급 기술까지Apr 18, 2025 am 09:31 AM

데이터 문제 : 정확한 통찰력을위한 SQL의 사례 명세서 마스터링 데이터 애호가가있을 때 누가 변호사가 필요합니까? 데이터 분석가, 과학자 및 방대한 데이터 세계의 모든 사람들은 자신의 복잡한 과제에 직면하여 시스템 기능을 보장합니다.

프롬프트 엔지니어링에서 지식 체인의 힘은 무엇입니까?Apr 18, 2025 am 09:30 AM

AI에서 지식 체인의 힘을 활용 : 신속한 엔지니어링에 대한 깊은 다이빙 인공 지능 (AI)이 귀하의 질문을 이해할뿐만 아니라 통찰력있는 답변을 제공하기 위해 방대한 양의 지식을 짜는 것도 알고 있습니까?

AI가 일과 삶의 균형을 달성하는 데 도움이 될 수 있습니까? - 분석 VidhyaApr 18, 2025 am 09:27 AM

소개 Joanna Maciejewska는 최근 X에 대한 통찰력있는 관찰을 공유했습니다. AI 푸시의 가장 큰 도전은? 오해되었습니다. 나는 AI가 세탁과 요리를 처리하기를 원합니다. - Joanna Ma

라마 3.1로 도구 용출에 대한 안내서Apr 18, 2025 am 09:26 AM

Meta 's Llama 3.1 : 오픈 소스 LLM 기능에 대한 깊은 다이빙 메타는 계속해서 오픈 소스 대형 언어 모델 (LLM)에서 청구를 계속하고 있습니다. 라마에서 라마 2, 라마 3, 라마 3.1로 진화하는 라마 가족은

SPC 차트는 무엇입니까? - 분석 VidhyaApr 18, 2025 am 09:24 AM

소개 통계 프로세스 제어 (SPC) 차트는 품질 관리의 필수 도구로 조직이 프로세스를 모니터링, 제어 및 개선 할 수 있도록합니다. 통계적 방법을 적용하여 SPC 차트는 시각적으로 데이터 변형을 나타냅니다.

상위 30 개의 MySQL 인터뷰 질문 - 분석 VidhyaApr 18, 2025 am 09:23 AM

이 안내서는 초보자, 중급 및 고급 레벨에 걸친 30 개의 질문을 다루어 MySQL 인터뷰에 적합합니다. 데이터 관리 및 분석의 중요한 도구 인 MySQL은 이론적 개념과 실제 쿼리 예를 통해 탐색됩니다.

비 관계형 데이터베이스 및 관계형 데이터베이스Apr 18, 2025 am 09:22 AM

올바른 데이터베이스 선택 : 관계형 대 비 관계형 번화 한 카페를 관리한다고 상상해보십시오. 수많은 주문, 주식 수준 변동 및 고객이 고객을 요구한다고 상상해보십시오. 효율적인 도구는 성공에 중요합니다. 마찬가지로 큰 데이터 세트를 처리하려면 c가 필요합니다. c

2025 년 상위 6 개 휴머노이드 로봇 - 분석 VidhyaApr 18, 2025 am 09:16 AM

휴머노이드 로봇 : 미래를 엿볼 수 있습니다 수세기 동안 복잡한 시계 메커니즘에서 정교한 AI 구동 창조물에 이르기까지 휴머노이드 로봇의 개념은 우리의 상상력을 사로 잡았습니다. Jacques de Vaucanson의 기계공과 같은 초기 사례

See all articles

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

SecList

SecLists는 최고의 보안 테스터의 동반자입니다. 보안 평가 시 자주 사용되는 다양한 유형의 목록을 한 곳에 모아 놓은 것입니다. SecLists는 보안 테스터에게 필요할 수 있는 모든 목록을 편리하게 제공하여 보안 테스트를 더욱 효율적이고 생산적으로 만드는 데 도움이 됩니다. 목록 유형에는 사용자 이름, 비밀번호, URL, 퍼징 페이로드, 민감한 데이터 패턴, 웹 셸 등이 포함됩니다. 테스터는 이 저장소를 새로운 테스트 시스템으로 간단히 가져올 수 있으며 필요한 모든 유형의 목록에 액세스할 수 있습니다.