Rumah >Peranti teknologi >AI >Aplikasi pemprosesan imej dan ekspresi dalam pembelajaran mesin
Pertama, mari kita fahami bagaimana imej hitam putih disimpan dalam komputer dalam format binari. Komputer menggunakan piksel untuk mewakili unit terkecil imej, dan setiap piksel hanya boleh menyimpan dua warna: hitam atau putih. Komputer mewakili hitam sebagai 0 dan putih sebagai 1, dan kemudian menyusun nilai warna setiap piksel ke dalam satu siri nombor binari untuk menyimpan keseluruhan imej hitam dan putih. Seterusnya, kita akan melihat bagaimana imej berwarna disimpan.
Setiap piksel dalam imej diwakili oleh nilai berangka ini dipanggil nilai piksel, yang mewakili kecerahan atau maklumat warna piksel. Dalam imej hitam dan putih, nilai piksel biasanya berkisar antara 0 hingga 1, di mana 0 mewakili hitam dan 1 mewakili putih.
Jadi setiap imej dalam komputer disimpan dalam bentuk ini, terdapat matriks nombor di dalamnya, matriks ini juga dipanggil saluran.
Imej skala kelabu ialah imej monokrom dengan hanya satu warna. Imej skala kelabu tidak mempunyai maklumat warna, hanya warna kelabu. Skala kelabu bukan hitam dan putih, tetapi warna kelabu yang berbeza. Jadi ia dipanggil skala kelabu.
Imej skala kelabu biasa biasanya mengandungi data 8 bit/piksel dan mempunyai 256 aras kelabu. Imej 12 atau 16 bit/piksel biasanya digunakan dalam pengimejan perubatan dan astronomi.
Nilai piksel bagi imej monokrom skala kelabu berjulat dari 0 hingga 255, dengan 0 mewakili warna paling gelap dan 255 mewakili warna paling terang.
Imej berwarna terdiri daripada tiga warna: merah, hijau dan biru Tiga saluran warna ini disusun dalam susunan RGB untuk membentuk timbunan. Imej digital warna moden juga mengikut prinsip ini, kerana semua warna boleh dihasilkan dengan mencampurkan tiga warna utama ini.
Memproses ruang tiga dimensi imej kadangkala menjadi rumit dan berlebihan. Dalam pengekstrakan ciri, memampatkan imej ke dalam matriks dua dimensi boleh memudahkan proses pemprosesan. Ini boleh dicapai melalui penskalaan skala kelabu atau perduaan. Penskalaan skala kelabu lebih kaya daripada penduaan kerana ia boleh memaparkan imej sebagai gabungan keamatan skala kelabu yang berbeza. Perduaan hanya membina matriks yang terdiri daripada 0s dan 1s.
Oleh itu, apabila melaksanakan tugas penglihatan komputer (CV) dalam pembelajaran mesin, ciri boleh diekstrak melalui pemampatan, seperti menukar kepada format skala kelabu atau binari.
Atas ialah kandungan terperinci Aplikasi pemprosesan imej dan ekspresi dalam pembelajaran mesin. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!