>기술 주변기기 >일체 포함 >나는 Openai Sora를 테스트했으며 여기에서 내가 발견 한 것을 테스트했습니다

나는 Openai Sora를 테스트했으며 여기에서 내가 발견 한 것을 테스트했습니다

Christopher Nolan
Christopher Nolan원래의
2025-03-15 10:36:09328검색

Openai는 공식적으로“12 Days of Openai”시리즈의 3 일째 Sora를 발표했습니다. 2024 년 4 월 첫 발표 이후 수개월의 긴장된 후, 소라는 AI 생성 비디오 컨텐츠 ​​공간에서 큰 도약으로 입증되었습니다. OpenAi는 원래 SORA 모델의 고급 가속 버전 인 Sora Turbo 모델을 출시했습니다. 새로 추가 된 기능을보고 시도해 봅시다!

우리의 휴가 선물 : 소라가 여기 있습니다. https://t.co/uhdmyughtt pic.twitter.com/ljoruqsfo0

- Openai (@openai) 2024 년 12 월 9 일

목차

  • 소라는 무엇입니까?
  • Openai Sora의 능력
  • Openai Sora를 테스트합니다
  • Sora에 액세스하는 방법?
  • Openai Sora 기능
    • 별도의 제품
    • 비디오 제작 및 편집
    • 이미지 업로드 및 향상
    • 테마 (사전 설정)
    • 종횡비 선택
    • 비디오 지속 시간
    • 텍스트 및 이미지 통합
    • 스토리 보드 (고급 제작)
    • 비디오 품질 및 해상도
  • 소라의 기술 기초
  • Openai Sora의 윤리적 고려
  • 주요 테이크 아웃
  • 결론

소라는 무엇입니까?

SORA는 고급 확산 모델변압기 아키텍처를 사용하여 서면 설명을 기반으로 비디오를 만드는 텍스트-비디오 생성기 입니다. 이 비디오는 노이즈부터 시작하여 여러 단계에서 점진적으로 정제하여 생성됩니다. 이 확산 프로세스를 통해 모델은 광범위한 텍스트 입력에서 현실적이고 일관된 비디오 시퀀스를 생성 할 수 있습니다.

Sora는 GPT , Dall · EClip을 통해 Openai의 이전 성공을 바탕으로 사용자가 처음부터 비디오를 만들거나 텍스트 프롬프트를 기반으로 기존 비디오를 확장 할 수 있도록하여 주요 도약을 소개합니다. 완전히 새로운 비디오를 생성하든 이미지를 애니메이션하는지 여부에 관계없이 Sora는 자연어에서 직접 시각적으로 매력적인 이야기를 만들 수있는 능력은 전례가 없습니다.

Openai Sora의 능력

  • 텍스트에서 비디오 생성 : 간단한 텍스트 프롬프트에서 비디오를 만듭니다.
  • 기존 비디오 확장 : 기존 비디오를 계속하거나 수정하십시오.
  • 애니메이션 이미지 : 애니메이션으로 스틸 이미지를 생생하게합니다.
  • 복잡한 장면 처리 : 여러 프레임에서 연속성을 유지하십시오.
  • 스케일 및 적응 : 다양한 형식과 길이로 비디오를 생성합니다.
  • 비디오 변환 : 텍스트 프롬프트를 기반으로 기존 비디오를 수정하십시오.

주요 개선

  • 현실적인 물리학 : 더 자연스러운 물체 운동.
  • 더 긴 비디오 : 최대 20 초 동안 비디오를 만듭니다.
  • 향상된 조명 : 동적 조명 효과로 시각적으로 매력적인 비디오.

Openai Sora를 테스트합니다

프롬프트 : 새끼 고양이와 함께 연주하는 White Dog에서 비디오 만들기

프롬프트 : 해변에서 춤추는 개 비디오를 만듭니다.

스토리 보드 프롬프트

즉각적인:

  • 생생한 애니메이션은 입에 들어가는 작고 빛나는 입자로 묘사 된 향정신성 분자를 보여줍니다. 배경은 인간 소화 시스템의 양식화 된 표현이며, 소용돌이 모양의 색상은 복잡한 여행의 시작을 시사합니다.
  • 분자는 혈류를 통해 붉은 색과 백혈구로 둘러싸여 있습니다. 그것은 혈관 네트워크를 통해 신속하게 움직이는 밝고 발광 입자로 묘사됩니다.
  • 분자는 혈액-뇌 장벽에 도달하여 반짝이는 벽으로 묘사되어 뇌에 들어가면서 침투합니다. 분자가 그들과 상호 작용함에 따라 뉴런과 시냅스가 조명되면서 장면이 더욱 복잡해집니다.

즉각적인:

  1. 따뜻하게 조명 된 어린이 방에서, 어린 소년과 소녀는 격자 무늬 담요와 베개로 구성된 아늑한 임시 변통 유르트 안에 앉아 있습니다. 그들은 장난스러운 모자와 펠트 부츠를 입고 부드러운 램프의 빛으로 둘러싸여 있습니다. 아이들은 장난감 순록을 가지고 놀면서 킥킥 웃으며, 그들의 눈은 상상력으로 반짝입니다.
  2. 아이들은 눈을 단단히 닫고 공중에서의 기대감입니다.
  3. 그들이 눈을 뜨면서, 그들은 진짜 유르트와 광대하고 눈 덮인 겨울 장면으로 둘러싸인 야쿠아의 현대적인 호텔 풍경 앞에 서서 성인으로 변모합니다.

관찰 : Chatgpt Plus 계정을 사용하여 비디오를 만드는 데 많은 시간이 걸렸지 만 개선의 범위가 많이 있음을 알 수 있습니다.

Sora에 액세스하는 방법?

SORA는 새 웹 사이트 인 SORA.com을 통해 축적 할 수 있습니다. chatgpt 계획을 사용하여 모델에 액세스 할 수 있습니다.

  • Chatgpt Plus 계정 :이 계획은 한 달에 50 세대를 제공합니다. 이들은 텍스트-비디오 작품의 수 또는 한 달에 다른 특정 작업과 관련이있을 수 있습니다.
  • OpenAi Pro 계정 : 이것은 느린 큐 모드에서 무제한 세대 와 한 달에 500 세대 더 빠른 세대를 제공합니다. 이 계층은 특정 세대의 작업을 더 빨리 처리 할 수있는 옵션을 사용하여 더 많은 유연성을 제공하는 데 중점을 두는 것으로 보이며 다른 작업은 더 느리게 대기 및 처리 될 수 있습니다.
  • 가용성 :이 서비스는 출시 당시 영국 및 EU 에 제공되지 않으며 법률, 규제 또는 데이터 개인 정보 보호 고려 사항 (예 : GDPR) 때문일 수 있습니다. 이 한계는 더 많은 지역으로 확장함에 따라 미래에 해제 될 수 있습니다.

Openai Sora 기능

나는 Openai Sora를 테스트했으며 여기에서 내가 발견 한 것을 테스트했습니다

별도의 제품

  • Sora는 Chatgpt 또는 기타 OpenAI 플랫폼에 통합되지 않은 독립형 제품입니다.
  • 최근에 생성 및 선별 된 비디오가 표시되는 SORA.com 을 통해 액세스 할 수 있습니다.

비디오 제작 및 편집

  • 프롬프트에서 비디오 생성 : 사용자는 텍스트 프롬프트를 기반으로 비디오를 만들 수 있습니다.
  • 이미지 업로드 : 사용자는 Sora가 비디오를 생성하는 데 사용할 수있는 이미지를 업로드 할 수도 있습니다.
  • 기능 : 사용자가 원하는 변경을 설명하여 기존 비디오를 변경할 수 있습니다.
    • 강도 설정 : 비디오가 얼마나 크게 변경 될지 제어하며, 더 높은 설정으로 예술적 변화가 더 높아집니다.
  • 비디오 편집 : SORA는 원래 도구에서 생성 한 비디오를 편집 할 수도 있습니다.

이미지 업로드 및 향상

나는 Openai Sora를 테스트했으며 여기에서 내가 발견 한 것을 테스트했습니다

  • 이미지 업로드 : 이미지를 업로드하여 비디오를 만들 수 있습니다. 이 이미지는베이스 역할을 할 수 있으며 추가 요소, 텍스트 또는 애니메이션으로 확장 할 수 있습니다.
  • 텍스트 설명 : 텍스트로 이미지를 설명 할 수도 있습니다. 설명이 자세히 설명할수록 비디오 제작이 더 구체적으로 지침을 따릅니다. 덜 자세한 설명을 위해이 도구는 일반적인 창의성과 세부 사항으로 격차를 메 웁니다.

테마 (사전 설정)

나는 Openai Sora를 테스트했으며 여기에서 내가 발견 한 것을 테스트했습니다

  • SORA는 비디오의 전반적인 테마를 정의하는 데 사용할 수있는 다양한 사전 설정을 제공합니다. 몇 가지 예는 다음과 같습니다.
    • 풍선 세계 : 이 사전 설정은 기발하거나 꿈 같은 분위기를 조성 할 수 있습니다.
    • 스톱 모션 : 스톱 모션 애니메이션 스타일을 모방하도록 설계된 사전 설정으로 비디오에 프레임별로 손으로 만들어진 모양을 제공합니다.

종횡비 선택

  • 비디오의 종횡비를 선택할 수 있습니다. 몇 가지 일반적인 옵션은 다음과 같습니다.
    • 16 : 9 (와이드 스크린) : 대부분의 비디오, 특히 YouTube, 와이드 스크린 영화 등에 이상적입니다.
    • 1 : 1 (Square) : Instagram과 같은 소셜 미디어 게시물에 적합합니다.
    • 9:16 (수직) : Tiktok 또는 Instagram 이야기와 같은 플랫폼에 적합합니다.

비디오 지속 시간

나는 Openai Sora를 테스트했으며 여기에서 내가 발견 한 것을 테스트했습니다

  • 비디오 지속 시간을 최대 20 초로 설정하여 포함 된 콘텐츠의 양에 대한 유연성을 제공합니다.

텍스트 및 이미지 통합

  • 이 플랫폼은 창의적인 표현을 위해 텍스트와 이미지의 조합을 허용합니다.
    • 이미지를 업로드하여 생성 : 이미지를 업로드하여 비디오의 기초 역할을 한 다음 추가 컨텐츠로 확장하거나 애니메이션하십시오.
    • 텍스트 기반 생성 : 텍스트를 사용하여 장면이나 이미지를 설명 할 수 있습니다. 텍스트가 더 구체적 일수록 비디오는 당신의 방향을 더 많이 따릅니다. 예를 들어, 자세한 설명은 비디오를 안내하여 언급 한 정확한 요소를 복제합니다.

스토리 보드 (고급 제작)

나는 Openai Sora를 테스트했으며 여기에서 내가 발견 한 것을 테스트했습니다

  • 보다 복잡한 비디오 프로젝트의 경우 스토리 보드 모드를 사용하면 타임 라인을 따라 비디오 제작을 지시 할 수 있습니다. 이것은 다음을 제공합니다.
    • 시퀀스에 대한 제어 : 요소 순서 (텍스트, 이미지 및 비디오)를 정의 할 수 있습니다.
    • 고급 편집 : 장면의보다 정확한 조정 및 시퀀싱이 가능합니다.
    • 멀티미디어 통합 : 이미지, 텍스트 및 비디오 클립을 결합하여 이야기 또는 복잡한 시각적 스토리를 만들 수 있습니다.

비디오 품질 및 해상도

나는 Openai Sora를 테스트했으며 여기에서 내가 발견 한 것을 테스트했습니다

  • 해상도 옵션 : 최대 1080p 해상도의 비디오를 생성합니다.
    • 1080p 영상은 480p에 비해 생성하는 데 8 배 더 오래 걸리며, 이는 가장 빠른 옵션입니다.
    • 720p는 480p보다 4 배 더 걸립니다.
    • 480p가 가장 빠릅니다.
  • 평균 생성 시간 : 1080p 비디오의 경우 몇 분 (사용자 수요 및 트래픽에 따라).

간단히 말해서

SORA는 강력한 사용자 정의 옵션을 갖춘 유연하고 사용자 친화적 인 비디오 제작 플랫폼입니다. 당신은 할 수 있습니다 :

  • 텍스트로 이미지를 업로드하거나 장면을 설명하십시오.
  • 풍선 세계 또는 스톱 모션과 같은 다양한 테마 사전 설정 중에서 선택하십시오.
  • 종횡비 및 비디오 지속 시간을 제어합니다.
  • 고급 비디오 편집 및 시퀀싱에는 스토리 보드 모드를 사용하십시오.

이 기능의 조합을 통해 사용자는 기술 지식이 최소화 되어도 매력적이고 전문적인 비디오를 쉽게 만들 수 있습니다.

이러한 기능은 SORA를 특히 비면성적이고 양식화 된 프로젝트를 위해 창의적인 비디오 컨텐츠를 생성하기위한 강력하지만 아직 가입하지 않은 도구로 개요됩니다.

소라의 기술 기초

SORA는 기본적으로 확산 모델을 기반으로 구축되어 무작위 노이즈로 시작하여 반복적으로 일관된 비디오로 개선합니다. 이 프로세스는 전통적인 이미지-이미지 확산 모델의 작동 방식을 반영하지만 비디오 시퀀스의 복잡성이 추가됩니다.

Sora의 혁신의 핵심은 이미지와 비디오 모두에 패치 기반 표현을 사용하는 것입니다. GPT의 토큰과 유사하게 SORA의 비디오 및 이미지는 더 작은 "패치"데이터로 분류됩니다. 이를 통해 모델은 크고 복잡한 시각적 데이터를보다 효율적으로 처리 할 수 ​​있으므로 다양한 기간 및 해상도에서 비디오를 생성 할 수 있습니다.

또한 SORA는 Dall · E 3 에 사용 된 요약 기술을 기반으로 훈련 데이터에 대한 설명적인 캡션을 생성 할 수 있습니다. 이 기능을 통해 모델은 텍스트 프롬프트를 면밀히 따를 수 있으므로 사용자 지침에 충실하고 입력 설명과 더 일치하는 비디오가 생깁니다.

또한 읽으십시오 : OpenAi의 Sora 확산 변압기 (DIT)는 무엇입니까?

Openai Sora의 윤리적 고려

소라가 당신이 기대하는 일은 다음과 같습니다.

  1. 동의 : 명시 적 허가를받은 사람들을 특징으로하는 미디어를 업로드하고 18 세 미만의 사람들이 적절한 동의를 받도록하십시오.
  2. 폭력과 명시 적 주제 : 폭력, 명시 적 주제 또는 성인 자료를 묘사하는 콘텐츠를 업로드하지 마십시오.
  3. 미디어에 대한 권리 : 공유하는 미디어를 업로드하는 데 필요한 소유권이나 권리가 있는지 확인하십시오.
  4. 결과 : 이러한 규칙을 위반하여 플랫폼을 잘못 사용하면 계정 정지 또는 환불없이 금지 할 수 있습니다.

주요 테이크 아웃

OpenAi의 SORA는 테마, 스토리 보드 모드 및 최대 1080p의 해상도와 같은 기능을 갖춘 텍스트-비디오 생성기입니다. 그러나 주목할만한 한계가 있습니다. 비디오는 20 초에 캡핑되며, 이는 더 긴 이야기에 적합하지 않을 수 있습니다. 고해상도 렌더링 (예 : 1080p)은 시간 집약적이며 해상도가 낮은 해상도와 비교하여 생성이 크게 둔화됩니다. 현재 SORA는 규제 문제로 인해 영국/EU에서 사용할 수 없습니다. 또한 윤리적 지침은 사용을 제한하고 위반은 계정 정지를 위험에 빠뜨립니다. Sora는 기술 및 접근성 개선의 여지가있는 강력하지만 여전히 진화하고 있습니다. 또한 세대 속도는 매우 느리고 고해상도 비디오 때문입니다. 그러나 OpenAI가 모델과 기본 인프라를 계속 최적화함에 따라 시간이 지남에 따라 개선되기를 바라고 있습니다. 향후 업데이트는 고해상도 비디오의 품질을 손상시키지 않으면 서 더 빠른 속도를 가져올 수있어 프로세스가보다 효율적이고 사용자 친화적입니다.

결론

SORA의 최종 릴리스는 인공 지능의 진화에서 놀라운 이정표로, NLP (Natural Language Processing) , 컴퓨터 비전딥 러닝 의 최신 발전을 결합하여 텍스트 프롬프트에서 직접 고품질의 단편 비디오를 생성합니다. 이 기술의 잠재적 영향은 창의적 산업에서 교육, 마케팅 및 그 이상으로 광범위합니다.

이 모델에 대한 Openai의 비전은 실제 세계 시뮬레이션 할 수있는 시스템을 만드는 궁극적 인 목표와 함께 광범위하고 있습니다. Sora가 발전함에 따라 실시간 비디오 생성, 대화식 스토리 텔링 및 가상 및 증강 현실과의 통합과 같은 고급 기능을 통합하여 기능이 확장 될 것입니다.

당신은 그것을 시도 했습니까? 아래 의견 섹션에서 귀하의 생각을 알려주세요!

위 내용은 나는 Openai Sora를 테스트했으며 여기에서 내가 발견 한 것을 테스트했습니다의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.