집 >기술 주변기기 >일체 포함 >2단계로 25프레임의 고품질 애니메이션 생성(SVD의 8%로 계산됨) |

2단계로 25프레임의 고품질 애니메이션 생성(SVD의 8%로 계산됨) |

PHPz앞으로: 2024-02-20 15:54:161042검색

소비되는 컴퓨팅 리소스는 기존 Stable Video Diffusion(SVD)모델의 2/25에 불과합니다!

시간이 많이 걸리고 많은 계산이 필요한 반복 노이즈 제거를 위해 비디오 확산 모델을 변경하는 AnimateLCM-SVD-xt가 출시되었습니다.

먼저 생성된 애니메이션 효과를 살펴보겠습니다.

사이버펑크 스타일은 제어하기 쉽고, 소년은 헤드폰을 끼고 네온 도시 거리에 서 있습니다.

两步生成25帧高质量动画，计算为SVD的8% | 在线可玩 사진

현실적인 스타일도 사용할 수 있습니다. 신혼 부부가 절묘한 꽃다발을 들고 함께 껴안고 있습니다. 고대 돌담 아래서 사랑을 목격하세요:

两步生成25帧高质量动画，计算为SVD的8% | 在线可玩 picture

공상 과학 스타일이며 외계인이 지구를 침략하는 느낌도 있습니다:

两步生成25帧高质量动画，计算为SVD的8% | 在线可玩 picture

AnimateLCM-SVD-xt from MMLab, The Chinese Avolution AI, Shanghai Artificial Intelligence Laboratory 및 SenseTime Research Institute의 연구원들이 공동으로 제안한 홍콩 대학교.

两步生成25帧高质量动画，计算为SVD的8% | 在线可玩 pictures

2~8단계로 25프레임, 해상도 576x1024로 고품질 애니메이션을 생성할 수 있으며, 분류자 안내 없이

, 4단계로 생성된 비디오는 높은 충실도를 달성할 수 있습니다. 기존 SVD보다 우수함 더 빠르고 효율적:

两步生成25帧高质量动画，计算为SVD的8% | 在线可玩 Pictures

현재 AnimateLCM 코드는 오픈 소스로 공개될 예정이며 평가판 플레이에 사용할 수 있는 온라인 데모가 있습니다.

데모를 시작해 보세요

데모 인터페이스에서 볼 수 있듯이 AnimateLCM에는 현재 세 가지 버전이 있습니다. AnimateLCM-SVD-xt는 일반 이미지부터 비디오 생성까지, 개인화된 텍스트부터 비디오까지 생성하는 데 사용됩니다. -i2v는 개인화된 이미지를 비디오로 생성하기 위한 것입니다.

两步生成25帧高质量动画，计算为SVD的8% | 在线可玩 Pictures

아래는 기본 Dreambooth 모델 또는 LoRA 모델을 선택하고 슬라이더를 통해 LoRA 알파 값을 조정할 수 있는 구성 영역입니다.

两步生成25帧高质量动画，计算为SVD的8% | 在线可玩 picture

다음으로 생성된 애니메이션의 내용과 품질을 안내하는 프롬프트와 부정 프롬프트를 입력할 수 있습니다.

两步生成25帧高质量动画，计算为SVD的8% | 在线可玩 pictures

조정할 수 있는 몇 가지 매개변수도 있습니다:

两步生成25帧高质量动画，计算为SVD的8% | 在线可玩 Pictures

시작하자 프롬프트 단어는 "하늘의 구름"이고 매개변수 설정은 위와 같으며 샘플링 단계는 단 4단계이며 생성된 효과는 다음과 같습니다.

两步生成25帧高质量动画，计算为SVD的8% | 在线可玩 picture

샘플링 단계는 25단계입니다. "토끼를 안고 있는 소년"이라는 단어가 표시되면 효과는 다음과 같습니다.

两步生成25帧高质量动画，计算为SVD的8% | 在线可玩 Pictures

공식 디스플레이 효과를 다시 살펴보겠습니다. 2단계, 4단계 및 8단계의 효과를 비교하면 다음과 같습니다.

两步生成25帧高质量动画，计算为SVD的8% | 在线可玩 pictures

4단계 AnimateLCM만이 높은 충실도를 얻을 수 있습니다.

两步生成25帧高质量动画，计算为SVD的8% | 在线可玩 pictures

각 모든 스타일을 실현할 수 있습니다:

两步生成25帧高质量动画，计算为SVD的8% | 在线可玩 pictures

🎜

两步生成25帧高质量动画，计算为SVD的8% | 在线可玩 사진

어떻게 하나요?

일관되고 충실도가 높은 비디오를 생성하는 능력으로 인해 비디오 확산 모델이 점점 더 많은 관심을 받고 있지만, 어려움 중 하나는 반복적인 노이즈 제거 프로세스가 시간이 많이 걸릴 뿐만 아니라 계산 집약적이어서 작업이 제한된다는 점에 유의하세요. 적용 범위.

이 연구 AnimateLCM에서 연구원들은 사전 훈련된 이미지 확산 모델을 단순화하여 샘플링에 필요한 단계를 줄이고 조건부 이미지 생성 잠재 일관성 모델 (LCM)에서 성공적으로 확장하는 일관성 모델 (CM)에서 영감을 받았습니다. ) .

两步生成25帧高质量动画，计算为SVD的8% | 在线可玩 Picture

구체적으로 연구진은 Decoupled Consistency Learning(Decoupled Consistency Learning) 전략을 제안했습니다.

먼저 고품질 이미지-텍스트 데이터 세트에서 안정적인 확산 모델을 이미지 일관성 모델로 증류한 다음 비디오 데이터에 대해 일관성 증류를 수행하여 비디오 일관성 모델을 얻습니다. 이 전략은 공간적, 시간적 수준에서 별도로 훈련하여 훈련 효율성을 향상시킵니다.

两步生成25帧高质量动画，计算为SVD的8% | 在线可玩 Pictures

또한 Stable Diffusion 커뮤니티에서 플러그 앤 플레이 어댑터의 다양한 기능을 구현하기 위해 (예: ControlNet을 사용하여 제어 가능한 생성 달성) 연구원들은 Teacher- (Teacher-Free Adaptation) 전략을 무료로 적용하여 기존 제어 어댑터를 일관성 모델과 더욱 일관되게 만들고 더 나은 제어 가능한 비디오 생성을 달성합니다.

两步生成25帧高质量动画，计算为SVD的8% | 在线可玩 Pictures

양적, 정성적 실험 모두 방법의 효과를 입증합니다.

UCF-101 데이터세트에 대한 제로샷 텍스트-비디오 생성 작업에서 AnimateLCM은 FVD 및 CLIPSIM 지표 모두에서 최고의 성능을 달성했습니다.

两步生成25帧高质量动画，计算为SVD的8% | 在线可玩 Picture

Ablation 연구는 분리된 일관성 학습 및 특정 초기화 전략의 효과를 검증합니다:

两步生成25帧高质量动画，计算为SVD的8% | 在线可玩 Picture

프로젝트 링크:
[1]https:// cm. github.io/
[2]https://huggingface.co/wangfuyun/AnimateLCM-SVD-xt

위 내용은 2단계로 25프레임의 고품질 애니메이션 생성(SVD의 8%로 계산됨) |의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

github 人工智能 stable diffusion https prompt

성명：

이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제

이전 기사：소라가 영상 세대를 폭발시켰을 때, 메타는 중국 작가들을 중심으로 Agent를 이용해 영상 자동 자르기를 시작했다.다음 기사：소라가 영상 세대를 폭발시켰을 때, 메타는 중국 작가들을 중심으로 Agent를 이용해 영상 자동 자르기를 시작했다.