Fail imej biasanya dimampatkan menggunakan lebihan pengekodan, lebihan antara piksel dan lebihan psikovisual. Lebihan data ialah masalah utama pemampatan imej digital Dalam pemampatan imej digital, tiga lebihan data asas boleh ditentukan dan digunakan: lebihan pengekodan, lebihan antara piksel dan lebihan psikovisual apabila ketiga-tiga jenis lebihan data ini (mengurangkan jumlah data yang diperlukan untuk mewakili jumlah maklumat tertentu) dicapai apabila satu atau lebih daripada dikurangkan atau dihapuskan.
Persekitaran pengendalian tutorial ini: sistem Windows 7, komputer Dell G3.
Masalah yang diselesaikan dengan pemampatan imej adalah untuk meminimumkan jumlah data yang diperlukan untuk mewakili imej digital dan untuk mengalih keluar lebihan data berdasarkan prinsip asas mengurangkan jumlah data.
Model pemampatan imej: Terutamanya memperkenalkan pengekodan dan penyahkodan sumber isyarat, dan tidak membincangkan saluran isyarat bagi proses penghantaran.
Mampatan data merujuk kepada mengurangkan jumlah data yang diperlukan untuk mewakili jumlah maklumat tertentu.
Data ialah cara untuk menghantar maklumat. Jumlah maklumat yang sama boleh diwakili oleh jumlah data yang berbeza.
Maklumat: digunakan untuk mewakili maklumat imej itu sendiri.
Lewahan data ialah masalah utama dalam pemampatan imej digital. Jika n1 dan n2 mewakili bilangan unit maklumat yang dibawa dalam dua set data yang mewakili maklumat yang sama, maka redundansi data relatif RD set data pertama (set yang diwakili oleh n1) boleh ditakrifkan ialah:
Di sini C biasanya dipanggil nisbah mampatan, ditakrifkan sebagai:
Dalam pemampatan imej digital , tiga jenis asas redundansi data boleh dikenal pasti dan dieksploitasi: redundansi pengekodan, redundansi antara piksel dan redundansi psikovisual. Pemampatan data dicapai apabila satu atau lebih daripada tiga redundansi ini dikurangkan atau dihapuskan.
Untuk imej, boleh diandaikan bahawa pembolehubah rawak diskret mewakili tahap kelabu imej, dan setiap tahap kelabu kebarangkalian berlakunya (rk) ialah pr
dengan L ialah aras kelabu, nk ialah bilangan kali tahap kelabu ke-k muncul dalam imej dan n ialah jumlah bilangan piksel dalam imej. Jika bilangan bit yang digunakan untuk mewakili setiap nilai rk ialah l(rk), maka purata bilangan bit yang diperlukan untuk menyatakan setiap piksel ialah:
Maksudnya, darabkan bilangan bit yang digunakan untuk mewakili setiap nilai tahap kelabu dan kebarangkalian kejadian tahap kelabu, dan tambahkan produk yang terhasil untuk mendapatkan kata kod purata untuk nilai tahap kelabu yang berbeza. panjang. Jika purata bilangan bit pengekodan tertentu lebih dekat dengan entropi, redundansi pengekodan adalah lebih kecil.
[Nota]
Entropi: Ia mentakrifkan jumlah purata maklumat yang diperolehi dengan memerhatikan output satu sumber
Contohnya:
Entropi imej asal ialah: 2.588
Menggunakan pengekodan binari semula jadi, panjang purata ialah 3
Jika menggunakan jadual Pengekodan sederhana 2, purata bilangan bit ialah:
untuk mencapai pemampatan pengekodan, pr(rk) dan l(r k) Kedua-dua fungsi ini didarab dan berkadar songsang. Maksudnya, semakin besar kebarangkalian pr (rk) bagi aras kelabu rk tertentu, semakin besar panjang pengekodan l (rk) hendaklah lebih kecil, yang mengurangkan purata bilangan bit dan membawanya lebih dekat kepada entropi. Seperti yang ditunjukkan di bawah:
Lewahan antara piksel ialah sejenis. korelasi antara piksel dikaitkan secara langsung dengan lebihan data.
Untuk gambar statik, terdapat redundansi ruang (geometrik redundansi) Ini kerana sumbangan visual satu piksel kepada imej dalam gambar selalunya berlebihan nilai skala kelabu.
Untuk gambar atau video yang berterusan, terdapat juga lebihan sementara (kelebihan antara bingkai) Kebanyakan piksel yang sepadan antara gambar bersebelahan secara perlahan-lahan berlebihan.
Psychovisual redundansi adalah berkaitan dengan maklumat visual sebenar. Mengalih keluar data psikovisual yang berlebihan pasti akan membawa kepada kehilangan maklumat kuantitatif, dan kehilangan maklumat visual ini merupakan operasi yang tidak boleh dipulihkan. Sama seperti imej (yang tidak boleh dibesarkan) agak kecil, mata manusia tidak boleh menilai secara langsung resolusinya Untuk memampatkan volum data imej, beberapa maklumat yang tidak dapat diperhatikan secara langsung oleh mata manusia boleh dialih keluar. apabila ia dibesarkan, ia tidak dialih keluar Imej dengan lebihan psikovisual akan berbeza dengan ketara daripada imej dengan lebihan psikovisual dialih keluar.
Rajah C menggambarkan bahawa proses kuantisasi yang menggunakan sepenuhnya ciri-ciri sistem visual manusia boleh meningkatkan prestasi imej dengan ketara Walaupun nisbah mampatan proses kuantisasi ini adalah masih hanya 2: 1, Overhed tambahan ditambah untuk mengurangkan kontur palsu, tetapi butiran yang tidak diingini dikurangkan Kaedah yang digunakan untuk menghasilkan keputusan ini ialah kaedah pengkuantitian skala kelabu yang dipertingkatkan Kaedah ini digambarkan dalam jadual di bawah. nilai tahap kelabu 8-bit semasa dan 4 bit terkecil yang dijana sebelum ini membentuk jumlah dengan nilai awal sifar Jika 4 bit paling ketara nilai semasa ialah 1111, tambahkan 0000 padanya. Nilai 4 bit paling ketara daripada jumlah yang diperolehi digunakan sebagai nilai piksel yang dikodkan.
Atas ialah kandungan terperinci Apakah redundansi yang biasanya digunakan untuk memampatkan fail imej?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!