Rumah > Artikel > Peranti teknologi > Klasifikasi Imej Penglihatan Komputer
Artikel ini dicetak semula daripada akaun awam WeChat "AI Origin", yang ditulis oleh pengarang Beishang. Untuk mencetak semula artikel ini, sila hubungi akaun awam AI Yuanqi.
Bolehkah anda memberitahu nombor?
Bercakap tentang AI, apa yang difikirkan oleh semua orang mestilah makhluk perkakasan pintar seperti MOSS dalam "The Wandering Earth 2". seperti Seperti Ultron dalam Avengers 2, dia menggunakan Internet untuk menyebarkan dirinya ke mana-mana, sentiasa memikirkan rancangan untuk menghapuskan manusia untuk mencapai "kedamaian dunia."
Walau bagaimanapun, pada hakikatnya, AI semasa masih jauh daripada apa yang dirasai dan dialami oleh semua orang dalam karya filem dan televisyen Ambil gambar hari ini Mengambil pengiktirafan digital sebagai contoh, mari kita teroka dalam bentuk AI sebenarnya wujud. Artikel tersebut akan diindeks oleh beberapa soalan utama untuk membantu anda memahaminya langkah demi langkah. Ikut saya, jom ~
Ini adalah gambar dengan nombor Saya percaya anda akan dapat bertindak balas serta-merta selepas melihatnya. Ini adalah gambar dengan nombor "3" (walaupun ia agak samar-samar).
Soalan pertama: Kepintaran sebenar - kenapa anda boleh tahu dengan jelas bahawa ini adalah nombor "3"? Apakah maksud ini?
Apabila anda melihat gambar ini, mata anda menukar isyarat optik kepada isyarat biologi yang boleh dikenali oleh otak melalui pantulan cahaya pada retina dan menyimpan sementara bahagian maklumat ini (hanya untuk membantu pemahaman, bukan sebenarnya ? ) pada retina anda. Selepas otak menerima isyarat, otak kecil anda yang pintar dengan cepat mengenali bahawa ini adalah nombor "3". Sudah tentu, asas semua ini ialah anda telah diajar sejak kecil bahawa nombor dalam bentuk ini adalah "bersamaan" dengan nombor 3, bukan 5, 6 dan nombor lain.
Soalan kedua: Mata, retina - apakah bentuk input yang digunakan komputer untuk mengenali dunia fizikal?
Apakah hubungan antara komputer dan AI? Kita hanya boleh memahami bahawa AI ialah sejenis keupayaan pseudo-pintar yang memerlukan kuasa pengkomputeran dan seni bina komputer, sama seperti kita sendiri mempunyai kecerdasan dan kehidupan, tetapi sebenarnya kita pada dasarnya adalah organisma berasaskan karbon. Seperti yang kita semua tahu, dunia komputer adalah dunia binari Apa itu binari? Saya tahu anda pasti mempunyai keraguan pada masa ini Bolehkah anda mencapai begitu banyak fungsi hanya dengan bergantung pada nombor binari yang sama ada 0 atau 1 Adakah anda mempunyai kuasa pengkomputeran yang begitu kuat? Tetapi jangan risau, ada konsep yang perlu dijelaskan di sini, iaitu binari boleh mewakili nombor dalam mana-mana asas (anda boleh fikir ia betul dahulu, dan kami akan membincangkannya kemudian jika anda memerlukannya secara khusus). Sebagai contoh, nombor 13 dalam sistem perpuluhan yang biasa kita gunakan, dalam binari Berikut adalah 1101. Rakan-rakan yang ingin mengkaji dengan teliti boleh melihat penjelasan gambar di bawah.
Jadi kita dapat melihat dengan jelas bahawa untuk sesuatu nombor, komputer boleh "memahami"nya melalui binari. Jika gambar boleh ditukar kepada rentetan nombor, adakah komputer boleh bertukar dari bodoh yang hanya tahu 0 dan 1 kepada satu yang boleh memasukkan maklumat dari gambar (jika anda tidak faham, letak tepi, sama seperti kanak-kanak mesti belajar makan dahulu apabila besar) . Seperti yang ditunjukkan dalam rajah di bawah, setiap kawasan kecil gambar boleh dianggap sebagai piksel, dan satu piksel mewakili warna Seperti yang kita semua tahu, mana-mana warna boleh melalui merah, hijau, biru ( Biru), kemudian kita boleh membentuk senarai nombor mengikut urutan dari kiri ke kanan dan atas ke bawah, dan kemudian menghantar kandungan ini ke komputer.
Pada ketika ini, tidak kira sama ada komputer memahaminya atau tidak, kami telah menukar gambar tersebut kepada isyarat yang boleh diterima oleh komputer otak mengenal pasti isyarat dalam gambar? Nombornya ialah "3"
Soalan ketiga: Apa yang dipanggil AI - bagaimana komputer harus menentukan bahawa nombor dalam gambar ini ialah "3"
Beri komputer dua gambar seperti ini. Ia boleh memberitahu anda bahawa gambar di sebelah kiri ialah nombor "3". Anda mungkin fikir ini terlalu naif, tetapi kanak-kanak berumur 3 tahun pun tahu perkara ini. Tetapi jika gambar di sebelah kanan menunjukkan 10,000 gambar boobies berkaki biru dan burung nadir yang lain, dan hanya mengambil masa beberapa saat untuk komputer mengenal pasti pelbagai makhluk jarang dengan ketepatan 99%, bukankah begitu? sedikit seperti AI?
Kaedah pengecaman tradisional - khususnya, kami telah dapat menukar imej kepada matriks digital Kaedah pengecaman imej tradisional akan mengenal pasti ciri-ciri dalam imej. Untuk pengekstrakan, sebagai contoh, beberapa peraturan keras akan digunakan sebagai ciri. Bagi nombor "3", apabila kita melihat bentuk ini di dalam otak kita, kita secara tidak sedar bertindak balas bahawa ia adalah "3", tetapi kepada komputer ia adalah rentetan nombor. Oleh itu, apabila melakukan tugas pengelasan imej yang serupa pada hari-hari awal, jurutera perlu memproses jujukan digital yang dipetakan kepada nombor "3", yang benar-benar menyusahkan. Jadi cara membuat ciri adalah proses yang penting tetapi amat menyusahkan dalam pengecaman dan pengelasan imej tradisional.
Kelebihan kaedah pengecaman tradisional ialah apabila hasil pengecaman salah, anda boleh menentukan secara kasar punca ralat dengan memaparkan ciri-cirinya ialah kejuruteraan ciri menyusahkan. Adakah terdapat cara untuk melemahkan kejuruteraan ciri (walaupun kejuruteraan ciri juga amat penting untuk banyak tugasan seterusnya) dan menyediakan penyelesaian hujung ke hujung. Apa yang dipanggil hujung ke hujung bermakna saya hanya perlu memberikan gambaran digital dan keputusan pengelasannya, dan biarkan komputer mempelajari penyelesaian pengecaman dengan sendirinya (adakah ia sedikit seperti idea pembelajaran manusia). Selepas perubahan zaman dan peningkatan ketara kuasa pengkomputeran komputer, algoritma pembelajaran mendalam berdasarkan rangkaian saraf telah digunakan secara beransur-ansur.
Kaedah pengecaman rangkaian saraf dalam - kata-kata ini sangat mendalam, mereka yang tidak mempelajari komputer atau melakukan algoritma mungkin takut secara langsung Terjemahan Terjemahan Apakah rangkaian saraf dalam (kepala anjing.jpg): Terdapat beberapa jenis korelasi bukan linear antara data input dan label yang ditentukan Rangkaian saraf menggunakan berbilang fungsi bukan linear untuk lebih kurang sesuai dengan bukan yang disebut di atas -kaitan linear. Seperti yang ditunjukkan di bawah, ia adalah rangkaian saraf dalam yang ringkas Gambar paling kiri (huruf "A"), dan bahagian kanan ialah struktur yang menukar gambar kepada nombor dan melakukan operasi "pintar", yang boleh difahami sebagai "otak. ".
Atas ialah kandungan terperinci Klasifikasi Imej Penglihatan Komputer. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!