강조:
연구원들은 인공지능이 생성한 이미지를 활용하여 매우 상세한 인공지능 이미지 모델을 훈련시키는 StableRep이라는 새로운 기술을 제안했습니다
StableRep은 수백만 장의 라벨이 붙은 합성 이미지를 사용하여 훈련하고, 학습 프로세스를 개선하기 위해 "다중 포지티브 대비 학습 방법"을 채택하고, 이를 오픈 소스 텍스트-이미지 모델 Stable Diffusion에 적용합니다
- ⚙️ StableRep은 ImageNet 분류에서 놀라운 성과를 거두었지만 이미지 생성 속도가 느리고 텍스트 힌트와 생성된 이미지 간의 의미 불일치 문제가 발생합니다.
웹마스터 홈(ChinaZ.com) 11월 28일 뉴스: MIT와 Google의 연구원들은 최근 AI가 생성한 이미지를 사용하여 보다 상세하고 효율적인 AI 이미지 모델을 훈련하는 것을 목표로 하는 StableRep이라는 새로운 기술을 개발했습니다. 이 기술은 오픈 소스 텍스트-이미지 모델 Stable Diffusion에 적용되어 일련의 주목할만한 성과를 달성했습니다.
StableRep은 "다중 양성 대비 학습 방법"이라는 독특한 방법을 사용합니다. 이 접근 방식에서는 동일한 텍스트 프롬프트에서 생성된 여러 이미지가 서로 긍정적인 대비로 간주되어 학습 과정을 향상시킵니다. 예를 들어, 풍경 텍스트 프롬프트의 경우 모델은 생성된 여러 풍경 이미지를 모든 관련 설명과 비교하여 이러한 이미지를 기반으로 작은 차이점을 찾아 최종 출력에 적용하여 매우 상세한 이미지를 생성합니다
연구원들은 그들의 방법이 여러 이미지를 단순히 픽셀 모음이 아닌 동일한 기본 사물의 표현으로 처리하는 데 탁월하다는 점에 주목합니다. 실험을 통해 StableRep이 Vision Transformer 모델을 사용한 ImageNet 분류 작업에서 76.7%의 선형 정확도를 달성한 것으로 입증되었습니다. 또한, 언어 감독을 도입함으로써 2천만 개의 합성 이미지로 훈련된 StableRep 모델이 5천만 개의 실제 이미지로 훈련된 CLIP 모델의 성능을 능가했습니다
그러나 안정적인 발전기에도 결함이 없는 것은 아닙니다. 이미지 생성 속도가 느리고 텍스트 프롬프트와 생성된 이미지 간의 의미 불일치로 인해 문제가 발생합니다. 또한 안정 생성기의 기본 모델인 안정 확산에는 실제 데이터에 대한 초기 교육이 필요하므로 안정 생성기를 사용하여 이미지를 생성하는 데 시간이 더 오래 걸리고 비용이 더 많이 들 수 있습니다
StableRep은 GitHub에서 오픈 소스로 제공되며 상업적 용도로 사용 가능합니다. 아파치 2.0 라이선스를 채택하고 있으며, 사용자는 이를 사용하고 2차 저작물을 생성할 수 있지만, 재배포되는 저작물이나 2차 저작물에는 아파치 라이선스 사본을 제공하고 변경 사항에 대한 공지를 포함해야 합니다. 또한 라이선스에는 라이선스가 부여된 저작물의 사용으로 인해 발생하는 손해에 대한 기여자의 책임에 대한 제한도 포함되어 있습니다. Stable Replica(StableRep)는 GitHub에 오픈소스로 공개되었으며 상업적 목적으로 사용할 수 있습니다. 사용자가 파생물을 사용하고 만들 수 있는 Apache2.0 라이센스를 채택합니다. 그러나 재배포 또는 파생 작업의 경우 사용자는 Apache 라이센스 사본을 제공하고 변경 사항을 알려야 합니다. 또한 이 라이선스는 라이선스가 부여된 저작물의 사용으로 인해 발생하는 모든 피해로부터 기여자에게 배상합니다
MIT와 Google의 이번 연구 결과는 인공지능 이미지 생성 분야의 혁신을 나타냅니다. 일부 결함이 있지만 고품질 이미지를 생성할 수 있는 새로운 방법과 아이디어를 제공합니다
위 내용은 MIT와 Google, 신기술 StableRep 공동 연구: 합성 이미지를 사용하여 AI 이미지 모델 학습의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!