Rumah >Peranti teknologi >AI >Saya menguji Openai Sora dan di sini ' s apa yang saya dapati

Saya menguji Openai Sora dan di sini ' s apa yang saya dapati

Christopher Nolan
Christopher Nolanasal
2025-03-15 10:36:09328semak imbas

Openai telah secara rasmi mengeluarkan Sora , pada hari ke -3 siri "12 Hari Openai" mereka. Selepas berbulan-bulan ketegangan sejak pengumuman pertama pada bulan April 2024, Sora telah membuktikan dirinya sebagai lompatan yang hebat dalam ruang kandungan video AI yang dihasilkan. OpenAI mengeluarkan model Sora Turbo, versi dipercepatkan mewah model SORA asal. Mari kita lihat ciri -ciri yang baru ditambah dan mencubanya!

Hadiah percutian kami kepada anda: Sora ada di sini. https://t.co/uhdmyughtt pic.twitter.com/ljoruqsfo0

- Openai (@openai) 9 Disember 2024

Jadual Kandungan

  • Apa itu Sora?
  • Keupayaan Openai Sora
  • Meletakkan Openai Sora untuk diuji
  • Bagaimana cara mengakses sora?
  • Ciri -ciri Openai Sora
    • Produk berasingan
    • Penciptaan video dan penyuntingan
    • Muat naik & peningkatan gambar
    • Tema (Pratetap)
    • Pemilihan nisbah aspek
    • Tempoh video
    • Integrasi teks & gambar
    • Papan cerita (penciptaan lanjutan)
    • Kualiti dan Resolusi Video
  • Asas Teknikal Sora
  • Pertimbangan Etika oleh Openai Sora
  • Takeaways utama
  • Kesimpulan

Apa itu Sora?

SORA adalah penjana teks-ke-video yang menggunakan model penyebaran maju dan seni bina pengubah untuk membuat video berdasarkan penerangan bertulis. Video ini dihasilkan dengan memulakan dengan bunyi bising dan secara progresif menyempurnakannya dalam pelbagai langkah. Proses penyebaran ini membolehkan model menghasilkan urutan video yang realistik dan koheren dari pelbagai input teks.

Membina kejayaan OpenAI sebelum dengan GPT , Dall · E , dan klip , Sora memperkenalkan lonjakan utama ke hadapan dengan membenarkan pengguna membuat video dari awal atau melanjutkan yang sedia ada berdasarkan arahan teks. Sama ada menghasilkan video yang sama sekali baru atau menghidupkan imej, keupayaan Sora untuk mencipta naratif yang menarik secara langsung dari bahasa semula jadi tidak pernah berlaku sebelum ini.

Keupayaan Openai Sora

  • Menjana video dari teks: Buat video dari arahan teks mudah.
  • Memperluas video sedia ada: Teruskan atau ubah suai video sedia ada.
  • Imej Animate: Bawa imej pegun ke kehidupan dengan animasi.
  • Mengendalikan adegan kompleks: Mengekalkan kesinambungan merentasi pelbagai bingkai.
  • Skala dan menyesuaikan diri: menghasilkan video dalam pelbagai format dan panjang.
  • Transform Video: Ubah suai video sedia ada berdasarkan arahan teks.

Penambahbaikan utama

  • Fizik Realistik: Pergerakan objek semula jadi.
  • Video yang lebih panjang: Buat video sehingga 20 saat.
  • Pencahayaan yang dipertingkatkan: video yang lebih menarik secara visual dengan kesan pencahayaan dinamik.

Meletakkan Openai Sora untuk diuji

Prompt: Buat video pada anjing putih bermain dengan anak kucing

Prompt: Buat video anjing menari di pantai.

Prompt Storyboard

Segera:

  • Animasi yang jelas menunjukkan molekul psikotropik yang ditelan, digambarkan sebagai zarah kecil dan bercahaya yang memasuki mulut. Latar belakang adalah perwakilan yang bergaya dari sistem pencernaan manusia, dengan warna berputar yang mencadangkan permulaan perjalanan yang kompleks.
  • Molekul bergerak melalui aliran darah, dikelilingi oleh sel darah merah dan putih. Ia digambarkan sebagai zarah yang cerah dan luminescent bergerak pantas melalui rangkaian saluran darah.
  • Molekul mencapai halangan otak darah, yang digambarkan sebagai dinding berkilauan, dan menembusnya, memasuki otak. Adegan menjadi lebih rumit, dengan neuron dan sinapsis menyala ketika molekul berinteraksi dengan mereka.

Segera:

  1. Di dalam bilik kanak -kanak yang hangat, seorang lelaki dan perempuan duduk di dalam yurt sementara yang dibina dari selimut dan bantal. Mereka berpakaian topi suka bermain dan merasakan kasut, dikelilingi oleh cahaya lampu lembut. Kanak -kanak tertawa ketika mereka bermain dengan rusa mainan, mata mereka berkilauan dengan imaginasi.
  2. Kanak -kanak menutup mata mereka dengan ketat, rasa jangkaan di udara.
  3. Ketika mereka membuka mata mereka, mereka berubah menjadi orang dewasa, berdiri di depan landskap hotel moden di Yakutia, dikelilingi oleh yurt sebenar dan adegan musim sejuk yang luas dan bersalji.

Pemerhatian: Semasa membuat video menggunakan akaun ChatGPT Plus membawa saya banyak masa, saya melihat terdapat banyak skop untuk penambahbaikan.

Bagaimana cara mengakses sora?

Sora boleh diserang melalui laman web baru - sora.com. Anda boleh menggunakan rancangan chatgpt anda untuk mendapatkan akses kepada model:

  • CHATGPT Plus Account : Pelan ini memberi anda 50 generasi sebulan . Ini boleh dikaitkan dengan bilangan ciptaan teks-ke-video atau tugas khusus lain setiap bulan.
  • Akaun Openai Pro : Ini menawarkan generasi tanpa had dalam mod giliran perlahan, ditambah 500 generasi lebih cepat sebulan. Tahap ini seolah -olah memberi tumpuan kepada menawarkan lebih banyak fleksibiliti, dengan pilihan untuk memproses tugas lebih cepat untuk beberapa generasi tertentu, sementara tugas -tugas lain mungkin beratur dan diproses lebih perlahan.
  • Ketersediaan : Perkhidmatan ini tidak akan tersedia untuk UK dan EU pada pelancaran, yang mungkin disebabkan oleh pertimbangan privasi undang -undang, pengawalseliaan, atau data (seperti GDPR). Batasan ini boleh diangkat pada masa akan datang ketika mereka berkembang ke lebih banyak wilayah.

Ciri -ciri Openai Sora

Saya menguji Openai Sora dan di sini ' s apa yang saya dapati

Produk berasingan

  • Sora adalah produk mandiri, tidak disatukan ke dalam ChatGPT atau platform OpenAI yang lain.
  • Boleh diakses melalui sora.com , di mana video yang dihasilkan dan dikendalikan baru -baru ini dipaparkan.

Penciptaan video dan penyuntingan

  • Menjana video dari Prompt : Pengguna boleh membuat video berdasarkan arahan teks.
  • Muat naik imej : Pengguna juga boleh memuat naik imej, yang boleh digunakan oleh Sora untuk menghasilkan video.
  • Ciri semula : membolehkan pengguna membuat perubahan kepada video sedia ada dengan menerangkan perubahan yang dikehendaki.
    • Tetapan Kekuatan : Mengawal bagaimana secara drastik video akan diubah, dengan tetapan yang lebih tinggi yang membawa kepada perubahan yang lebih banyak artistik.
  • Pengeditan Video : SORA juga boleh mengedit video yang pada asalnya dihasilkan oleh alat tersebut.

Muat naik & peningkatan gambar

Saya menguji Openai Sora dan di sini ' s apa yang saya dapati

  • Muat naik imej: Anda boleh memulakan dengan memuat naik imej untuk membuat video. Imej ini boleh berfungsi sebagai asas, dan anda boleh memanjangkannya dengan elemen, teks, atau animasi selanjutnya.
  • Penerangan Teks: Anda juga boleh menerangkan imej dengan teks. Lebih terperinci penerangan anda, lebih spesifik penciptaan video akan mengikuti arahan anda. Untuk penerangan yang kurang terperinci, alat ini akan mengisi jurang dengan kreativiti dan perincian umum.

Tema (Pratetap)

Saya menguji Openai Sora dan di sini ' s apa yang saya dapati

  • SORA menyediakan pelbagai pratetap yang boleh digunakan untuk menentukan tema keseluruhan video. Beberapa contoh termasuk:
    • Dunia belon: Pratetap ini mungkin mewujudkan suasana yang aneh atau mimpi.
    • Berhenti Gerakan: Pratetap yang direka untuk mencontohi gaya animasi berhenti-gerakan, memberikan video anda bingkai demi bingkai, rupa buatan tangan.

Pemilihan nisbah aspek

  • Anda boleh memilih nisbah aspek untuk video anda. Beberapa pilihan biasa termasuk:
    • 16: 9 (skrin lebar): Ideal untuk kebanyakan video, terutamanya untuk YouTube, filem skrin lebar, dll.
    • 1: 1 (persegi): Sesuai untuk jawatan media sosial seperti Instagram.
    • 9:16 (menegak): Sempurna untuk platform seperti Tiktok atau Instagram Story.

Tempoh video

Saya menguji Openai Sora dan di sini ' s apa yang saya dapati

  • Anda boleh menetapkan tempoh video anda sehingga 20 saat , memberikan anda fleksibiliti dalam berapa banyak kandungan yang disertakan.

Integrasi teks & gambar

  • Platform ini membolehkan gabungan kedua -dua teks dan imej untuk ekspresi kreatif:
    • Buat dengan memuat naik imej: Anda memuat naik imej untuk berfungsi sebagai asas untuk video anda, kemudian melanjutkan atau menghidupkannya dengan kandungan tambahan.
    • Penciptaan berasaskan teks: Anda boleh menerangkan adegan atau imej menggunakan teks. Semakin spesifik teks, semakin banyak video mengikuti arah anda. Sebagai contoh, penerangan terperinci akan membimbing video untuk meniru elemen tepat yang anda sebutkan.

Papan cerita (penciptaan lanjutan)

Saya menguji Openai Sora dan di sini ' s apa yang saya dapati

  • Untuk projek video yang lebih kompleks, Mod Storyboard membolehkan anda mengarahkan penciptaan video sepanjang garis masa. Ini menyediakan:
    • Kawalan ke atas urutan: Anda boleh menentukan susunan elemen (teks, imej, dan video).
    • Pengeditan Lanjutan: Ia membolehkan pelarasan yang lebih tepat dan penjujukan adegan.
    • Integrasi Multimedia: Anda boleh menggabungkan imej, teks, dan klip video untuk mencipta cerita visual naratif atau kompleks.

Kualiti dan Resolusi Video

Saya menguji Openai Sora dan di sini ' s apa yang saya dapati

  • Pilihan Resolusi : Menjana video sehingga resolusi 1080p .
    • Rakaman 1080p mengambil 8x lebih lama untuk menjana berbanding 480p, yang merupakan pilihan terpantas.
    • 720p mengambil 4x lebih lama daripada 480p.
    • 480p adalah yang terpantas.
  • Waktu penjanaan purata : Beberapa minit untuk video 1080p (tertakluk kepada permintaan pengguna dan lalu lintas).

Ringkasnya,

Sora adalah platform penciptaan video yang fleksibel dan mesra pengguna dengan pilihan penyesuaian yang kuat. Anda boleh:

  • Muat naik imej atau terangkan adegan dengan teks.
  • Pilih dari pelbagai pratetap tema seperti World Balloon atau Berhenti Gerakan.
  • Nisbah aspek kawalan dan tempoh video.
  • Gunakan mod Storyboard untuk penyuntingan dan penjujukan video canggih.

Gabungan ciri-ciri ini memudahkan pengguna membuat video yang menarik dan profesional, walaupun dengan pengetahuan teknikal yang minimum.

Ciri-ciri ini menggariskan SORA sebagai alat yang kuat tetapi masih imperfect untuk menghasilkan kandungan video kreatif, terutamanya untuk projek-projek yang tidak fotorealistik dan bergaya.

Asas Teknikal Sora

Sora pada asasnya dibina di atas model penyebaran , teknik yang bermula dengan bunyi rawak dan secara berulang -ulang menyempurnakannya ke dalam video yang koheren. Proses ini mencerminkan bagaimana model penyebaran imej-ke-imej tradisional berfungsi, tetapi dengan kerumitan tambahan urutan video.

Kunci inovasi Sora adalah penggunaan perwakilan berasaskan patch untuk kedua-dua imej dan video. Sama seperti token dalam GPT, video dan imej di SORA dipecahkan kepada "patch" yang lebih kecil daripada data. Ini membolehkan model memproses data visual yang besar dan kompleks dengan lebih cekap, menjadikannya mampu menghasilkan video merentasi pelbagai tempoh dan resolusi.

Selain itu, SORA membina teknik penangkapan semula yang digunakan dalam Dall · E 3 , yang membolehkannya menghasilkan kapsyen yang sangat deskriptif untuk data latihannya. Keupayaan ini membolehkan model untuk mengikuti arahan teks dengan teliti, menghasilkan video yang setia kepada arahan pengguna dan lebih sejajar dengan penerangan input.

Juga Baca: Apakah Transformer Penyebaran Sora Openai (DIT)?

Pertimbangan Etika oleh Openai Sora

Inilah yang diharapkan oleh Sora yang anda lakukan:

  1. Persetujuan : Hanya memuat naik media yang memaparkan orang dengan kebenaran eksplisit mereka, dan memastikan mereka di bawah 18 mempunyai persetujuan yang sesuai.
  2. Keganasan dan Tema Eksplisit : Jangan memuat naik kandungan yang menggambarkan keganasan, tema eksplisit, atau bahan dewasa.
  3. Hak kepada Media : Memastikan anda mempunyai pemilikan atau hak yang diperlukan untuk memuat naik media yang anda kongsi.
  4. Akibat : Menyalahgunakan platform dengan melanggar peraturan ini boleh mengakibatkan penggantungan akaun atau larangan tanpa bayaran balik.

Takeaways utama

Openai's Sora adalah penjana teks-ke-video dengan ciri-ciri seperti tema, mod papan cerita, dan resolusi sehingga 1080p. Walau bagaimanapun, ia mempunyai batasan yang ketara. Video dihadkan pada 20 saat, yang mungkin tidak sesuai dengan naratif yang lebih lama. Rendering resolusi tinggi (misalnya, 1080p) adalah intensif masa, generasi perlahan dengan ketara berbanding dengan resolusi yang lebih rendah. Pada masa ini, SORA tidak tersedia di UK/EU disebabkan oleh isu pengawalseliaan, mengehadkan akses. Di samping itu, garis panduan etika menyekat penggunaan, dan pelanggaran risiko penggantungan akaun. Sora berkuasa tetapi masih berkembang, dengan ruang untuk penambahbaikan teknikal dan aksesibiliti. Juga, kelajuan generasi adalah agak perlahan, dan ia disebabkan oleh video resolusi tinggi. Tetapi saya berharap ia akan bertambah baik dari masa ke masa kerana OpenAI terus mengoptimumkan model dan infrastruktur yang mendasari. Kemas kini masa depan mungkin membawa kelajuan generasi yang lebih cepat tanpa menjejaskan kualiti video resolusi tinggi, menjadikan proses lebih cekap dan mesra pengguna.

Kesimpulan

Siaran akhir Sora adalah peristiwa penting dalam evolusi kecerdasan buatan, menggabungkan kemajuan terkini dalam pemprosesan bahasa semulajadi (NLP) , penglihatan komputer , dan pembelajaran mendalam untuk menjana video berkualiti tinggi, pendek dari teks. Implikasi potensi teknologi ini jauh, dari industri kreatif hingga pendidikan, pemasaran, dan seterusnya.

Visi Openai untuk model ini meluas, dengan matlamat utama untuk mewujudkan sistem yang dapat mensimulasikan dunia nyata, membawa kita satu langkah lebih dekat dengan realisasi kecerdasan umum buatan (AGI) . Apabila Sora berkembang, keupayaannya mungkin akan berkembang, menggabungkan ciri-ciri yang lebih maju seperti penjanaan video masa nyata, bercerita interaktif, dan juga integrasi dengan realiti maya dan tambahan.

Adakah anda mencubanya? Izinkan saya tahu fikiran anda di bahagian komen di bawah!

Atas ialah kandungan terperinci Saya menguji Openai Sora dan di sini ' s apa yang saya dapati. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn