Rumah > Soal Jawab > teks badan
Saya ingin menganalisis intensiti (kenyaringan) pertuturan melalui sepotong ucapan.
Oleh kerana saya anjing kejuruteraan dan bukannya anjing sains, dan saya orang luar dalam analisis isyarat audio, saya hanya melihat FFT secara ringkas, jadi saya berasa tidak selamat tentang kaedah saya sendiri untuk menganalisis keamatan suara. Saya harap pakar dalam bidang ini dapat memberi tunjuk ajar. Terima kasih banyak-banyak! ! !
Berikut ialah proses saya mendapatkan data isyarat suara. Fail suara 123.wav berasal daripada transkoding mp3 yang disintesis oleh Baidu, jadi walaupun terdapat bunyi bising dalam suara ini, ia sepatutnya minimum. Tidak perlu menapisnya di sini (walaupun ia ditapis, saya tidak tahu apakah pekali penapis yang sepatutnya). Saya rasa sepatutnya tiada masalah pada ketika ini?
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 |
|
Graf gelombang (panjang masa ialah kira-kira 1.8s)
Saya berharap untuk memberitahu keamatan suara semasa memainkan suara ini, tetapi jelas kekerapannya terlalu cepat, dan ia tidak sepatutnya begitu pantas, contohnya, statistik sekali setiap 0.2s mungkin lebih sesuai.
Saya ada 2 idea, tetapi saya tidak pasti dan rasa tidak selamat:
1 2 |
|
Saya tidak faham pemprosesan isyarat audio, jadi saya tidak tahu sama ada salah satu daripada dua penyelesaian ini boleh mewakili keamatan pertuturan. Atau perlu menggunakan kaedah lain.
Ringkasnya, 2 soalan:
1 2 3 |
|
仅有的幸福2017-05-18 11:01:32
Bunyi ialah gelombang getaran mekanikal
Keamatannya ialah amplitud
Treble dan bass ialah kekerapan