Rumah >masalah biasa >Berapakah bilangan sampel audio yang dikumpul sesaat

Berapakah bilangan sampel audio yang dikumpul sesaat

青灯夜游asal: 2022-09-01 15:39:033234semak imbas

Bilangan sampel audio yang diambil sesaat dirujuk sebagai "frekuensi pensampelan", yang diukur dalam sampel sesaat atau Hertz. Kadar sampel yang lebih rendah bermakna lebih sedikit sampel sesaat, yang seterusnya bermakna kurang data audio kerana terdapat lebih sedikit titik sampel untuk mewakili jumlah audio yang lebih tinggi memerlukan ruang storan dan kuasa pemprosesan untuk dikendalikan.

Persekitaran pengendalian tutorial ini: sistem Windows 7, komputer Dell G3.

Mengenai pemprosesan audio, terdapat banyak istilah yang kebanyakan orang pernah dengar sebelum ini, tetapi tidak benar-benar faham. Saya pernah menjadi salah seorang daripada mereka sebelum saya perlu pergi ke pemprosesan audio. Untuk melakukan ini, saya ingin bercakap tentang beberapa istilah ini, menerangkan maksudnya dan menunjukkan maksudnya untuk kualiti rakaman atau strim audio anda. Untuk baki artikel ini, kami akan menganggap bahawa kami hanya berurusan dengan satu saluran audio tidak dimampatkan.

1. Kadar pensampelan/kekerapan pensampelan

Istilah pertama yang sering kita dengar ialah kadar pensampelan atau kekerapan pensampelan, kedua-duanya merujuk kepada perkara yang sama. Beberapa nilai yang mungkin anda temui ialah 8kHz, 44.1kHz dan 48kHz. Apakah sebenarnya kadar sampel fail audio?

Kadar pensampelan merujuk kepada bilangan sampel audio yang dirakam sesaat. Ia diukur dalam sampel sesaat atau hertz (disingkatkan sebagai Hz atau kHz, 1kHz ialah 1000Hz). Sampel audio hanyalah nombor yang mewakili nilai gelombang bunyi yang diukur pada titik masa tertentu. Adalah sangat penting bahawa sampel ini diambil pada masa yang sama dalam masa dalam satu saat. Sebagai contoh, jika kadar persampelan ialah 8000 Hz, maka tidak mencukupi untuk mempunyai 8000 sampel dalam satu saat; ia mesti dikumpulkan tepat dalam 1/8000 saat. Dalam kes ini, nombor 1/8000 dipanggil selang pensampelan (dalam saat), dan kadar pensampelan hanyalah timbal balik darab selang itu.

Kadar pensampelan adalah serupa dengan kadar bingkai video atau ukuran FPS (bingkai sesaat). Video hanyalah satu siri gambar, sering dipanggil "bingkai" di sini, dipaparkan secara berbalik ke belakang dengan pantas, memberikan ilusi gerakan atau pergerakan tanpa gangguan yang berterusan (sekurang-kurangnya kepada kita manusia).

Walaupun kadar sampel audio dan kadar bingkai video adalah serupa, bilangan minimum biasa yang menjamin kebolehgunaan dalam setiap satu adalah sangat berbeza. Untuk video, untuk memastikan perihalan gerakan yang tepat, sekurang-kurangnya 24 bingkai sesaat diperlukan kurang daripada nombor ini, gerakan itu mungkin kelihatan tidak lancar, dan ilusi gerakan berterusan tanpa gangguan tidak dapat dikekalkan. Ini benar terutamanya apabila lebih banyak gerakan berlaku antara bingkai. Selain itu, video pada 1 atau 2 bingkai sesaat mungkin mempunyai acara "sesaat" yang dijamin akan terlepas antara bingkai.

Untuk audio, untuk mewakili pertuturan bahasa Inggeris dengan jelas, bilangan minimum sampel sesaat ialah 8000 Hz. Menggunakan kadar persampelan yang lebih rendah daripada nombor ini akan menyebabkan pertuturan tidak dapat difahami atas pelbagai sebab, salah satunya ialah sebutan yang serupa tidak dapat dibezakan antara satu sama lain. Kadar pensampelan yang lebih rendah boleh mengelirukan fonem, atau bunyi dalam bahasa, yang mempunyai tenaga frekuensi tinggi yang ketara sebagai contoh, pada 5000 Hz, sukar untuk membezakan /s/ daripada /sh/ atau /f/.

Sekarang kita menyebut bingkai video, istilah lain yang patut dihuraikan ialah bingkai audio. Walaupun sampel audio dan bingkai audio kedua-duanya diukur dalam Hertz, ia bukanlah perkara yang sama. Bingkai audio ialah sekumpulan sampel audio daripada satu contoh masa satu atau lebih saluran audio.

Nilai kadar sampel yang paling biasa ialah 8kHz yang disebut di atas (paling biasa dalam komunikasi telefon), 44.1kHz (paling biasa dalam CD muzik) dan 48kHz (paling biasa dalam runut bunyi filem). Kadar sampel yang lebih rendah bermakna lebih sedikit sampel sesaat, yang seterusnya bermakna kurang data audio kerana terdapat lebih sedikit titik sampel untuk mewakili jumlah audio. Pilihan kadar persampelan bergantung pada artifak akustik yang perlu dikumpul. Sesetengah artifak akustik seperti intonasi pertuturan memerlukan kadar persampelan yang lebih rendah daripada artifak akustik seperti lagu muzik pada CD muzik. Perlu diingat bahawa kadar sampel yang lebih tinggi memerlukan lebih banyak ruang storan dan kuasa pemprosesan untuk dikendalikan, walaupun ini mungkin tidak begitu menjadi isu sekarang apabila storan digital dan kuasa pemprosesan menjadi kebimbangan utama pada masa lalu.

2. Kedalaman pensampelan/ketepatan pensampelan/saiz pensampelan

Selain kadar pensampelan, iaitu jumlah titik data audio yang kita ada, terdapat juga kedalaman pensampelan. Diukur dalam bit setiap sampel, kedalaman sampel (juga dipanggil ketepatan sampel atau saiz sampel) ialah sifat penting kedua bagi fail audio atau aliran audio dan mewakili tahap perincian, atau "kualiti", setiap sampel. Seperti yang kami nyatakan di atas, setiap sampel audio hanyalah nombor, dan walaupun mempunyai banyak nombor membantu mewakili audio, anda juga memerlukan julat atau "jisim" setiap nombor individu supaya cukup besar untuk mewakili setiap sampel atau titik data dengan tepat. Apakah maksud "kualiti"? Untuk sampel audio, ini bermakna sampel audio boleh mewakili julat amplitud yang lebih tinggi. Kedalaman pensampelan 8 bit bermakna kita mempunyai 2^8=256 amplitud berbeza, manakala kedalaman pensampelan 16 bit bermakna kita mempunyai 2^16=65,536 amplitud berbeza, dan seterusnya untuk kedalaman pensampelan yang lebih tinggi. Kedalaman sampel yang paling biasa untuk audio telefon ialah 16-bit dan 32-bit. Dalam rakaman digital, lebih banyak amplitud berbeza, lebih dekat rakaman digital akan berbunyi dengan acara akustik asal.

Sekali lagi, ini serupa dengan nombor 8-bit atau 16-bit yang mungkin kita dengar tentang kualiti imej. Untuk imej atau video, setiap piksel dalam imej atau bingkai video juga mempunyai bilangan bit tertentu untuk mewakili warna. Lebih tinggi kedalaman bit dalam piksel, lebih tepat warna piksel yang terhasil, kerana piksel mempunyai lebih banyak bit untuk "menggambarkan" warna yang akan diwakili pada skrin dan piksel atau imej secara keseluruhan kelihatan lebih seperti apa yang orang akan lihat dalam kehidupan sebenar. Secara teknikal, kedalaman bit piksel menunjukkan bilangan warna berbeza yang boleh diwakili oleh piksel. Jika anda membenarkan setiap R, G dan B diwakili oleh 8 bit, maka setiap piksel diwakili oleh 3 x 8 = 24 bit. Ini bermakna terdapat 2^24~17 juta warna berbeza yang boleh diwakili oleh piksel tersebut.

3. Kadar bit

Apa yang memautkan kadar pensampelan dan kedalaman pensampelan ialah kadar bit, yang merupakan produk mudah daripada kedua-duanya. Oleh kerana kadar pensampelan diukur dalam sampel sesaat dan kedalaman pensampelan diukur dalam bit setiap sampel, ia dikira sebagai (sampel sesaat) x (bit setiap sampel) = Diukur dalam bit sesaat, disingkatkan sebagai bps atau kbps. Perlu diingat bahawa kerana kedalaman sampel dan kadar bit adalah berkaitan, ia sering digunakan secara bergantian, tetapi juga secara salah.

Kadar bit dalam audio berbeza mengikut aplikasi. Aplikasi yang memerlukan kualiti audio yang tinggi, seperti muzik, biasanya mempunyai kadar bit yang lebih tinggi, menghasilkan kualiti yang lebih tinggi atau audio yang "lebih jelas". Audio telefon, termasuk audio pusat panggilan, tidak memerlukan kadar bit yang tinggi, jadi kadar bit panggilan telefon biasa biasanya jauh lebih rendah daripada CD muzik. Sama ada kadar sampel atau kadar bit, nilai yang lebih rendah mungkin kedengaran lebih teruk, tetapi sekali lagi, bergantung pada aplikasi, nilai yang lebih rendah mungkin menjimatkan ruang storan dan/atau kuasa pemprosesan.

Ringkasnya, apakah sebenarnya yang dimaksudkan dengan pemampatan apabila ia berkaitan dengan audio? Format audio termampat, seperti AAC atau MP3, mempunyai kadar bit yang lebih kecil daripada produk sebenar kadar sampel dan kedalaman sampel. Format ini dilaksanakan dengan "membedah" mengalih keluar maklumat daripada aliran bit, bermakna bahawa frekuensi atau amplitud yang secara biologi tidak dapat didengari oleh telinga manusia dalam situasi dinamik tidak disimpan, menghasilkan saiz fail keseluruhan yang lebih kecil.

Untuk lebih banyak pengetahuan berkaitan, sila lawati ruangan Soalan Lazim!

Atas ialah kandungan terperinci Berapakah bilangan sampel audio yang dikumpul sesaat. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

事件

Kenyataan：

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel sebelumnya：Apakah platform Yin Ge?Artikel seterusnya：Apakah platform Yin Ge?

Artikel berkaitan

Lihat lagi