Rumah > Artikel > Peranti teknologi > Menggunakan bahan 2D dan pembelajaran mesin yang unik, CV "melihat" berjuta-juta warna seperti manusia
Mata manusia boleh melihat berjuta-juta warna, dan kini kecerdasan buatan juga boleh melihat.
Baru-baru ini, pasukan penyelidik antara disiplin dari Northeastern University menggunakan teknologi kecerdasan buatan baharu untuk membina peranti baharu, A-Eye, yang boleh mengenali berjuta-juta warna Bidang penglihatan mesin telah diambil satu langkah besar ke hadapan dan akan digunakan secara meluas dalam pelbagai teknologi seperti kereta pandu sendiri, pengisihan pertanian dan pengimejan satelit jauh.
Kertas penyelidikan telah diterbitkan dalam Materials Today.
Alamat kertas: https://www.sciencedirect.com/science/article/abs/pii /S1369702122002255
Swastik Kar, pengarang kajian yang sepadan dan profesor fizik bersekutu di Northeastern University, berkata: "Apabila automasi semakin meluas, mesin menjadi semakin berkebolehan mengenali warna dan bentuk objek "
Penyelidikan mereka bentuk bahan 2D dengan sifat kuantum khas, yang boleh digunakan untuk membenamkan cahaya ke dalam tingkap optik mesin A-Eye. dengan "sangat tinggi Memproses pelbagai warna yang kaya dengan ketepatan yang tidak pernah berlaku sebelum ini.
Tambahan pula, A-Eye dapat mengenal pasti dan menghasilkan semula warna "dilihat" dengan tepat dengan sisihan sifar daripada spektrum asal. Ini boleh dilakukan terima kasih kepada algoritma pembelajaran mesin yang dibangunkan oleh pasukan penyelidik AI yang diketuai oleh Sarah Ostadabbas, penolong profesor kejuruteraan elektrik dan komputer di Northeastern University.
Teknologi utama keseluruhan penyelidikan memfokuskan pada sifat kuantum dan optik kelas bahan yang dipanggil logam peralihan dichalcogenides Bahan unik ini telah dianggap mempunyai potensi tanpa had, terutamanya dalam penderiaan dan aplikasi penyimpanan tenaga.
Apabila mengenal pasti warna, mesin biasanya menggunakan penapis RGB (merah, hijau dan biru) tradisional untuk memecahkan warna kepada bahagian komponennya dan kemudian menggunakan bahawa Maklumat pada dasarnya meneka dan mengeluarkan semula tiga warna utama cahaya. Apabila anda menghalakan kamera digital anda pada objek berwarna dan mengambil gambar, cahaya daripada objek itu melalui set pengesan dengan penapis di hadapannya yang memisahkan cahaya kepada warna RGB mentah ini.
Kar berkata, “Anda boleh menganggap penapis warna sebagai corong yang membawa maklumat visual atau data ke dalam kotak yang berasingan, dan corong tersebut kemudiannya menetapkan nombor tiruan kepada warna semula jadi "Tetapi jika anda hanya pecahkan warna kepada tiga komponennya (merah, hijau dan biru), terdapat beberapa batasan.
Walau bagaimanapun, bukannya menggunakan penapis warna, Kar dan pasukannya menggunakan "tingkap transmissive" yang diperbuat daripada bahan 2D yang unik.
Kar berkata mereka mendapat mesin (iaitu A-Eye) untuk mengecam warna dengan cara yang berbeza sama sekali. Apabila cahaya berwarna mengenai pengesan, bukannya memecahkannya kepada komponen merah, hijau dan biru utamanya atau hanya mencari komponen tersebut, para penyelidik menggunakan keseluruhan spektrum maklumat.
Paling penting, penyelidik menggunakan beberapa teknik untuk mengubah suai dan mengekod bahan-bahan ini dan menyimpannya dalam cara yang berbeza. Oleh itu, mereka diberi satu set nombor dan dapat mengenal pasti warna primer dengan cara yang sangat berbeza daripada konvensional.
Sebelah kiri atas gambar di bawah menunjukkan bahan 2D yang digunakan untuk membina A-Eye, sebelah kanan atas menunjukkan aliran kerja A-Eye, dan bahagian bawah gambar menunjukkan warna perbandingan antara warna ujian dan anggaran A-Eye.
Pengarang lain, Sarah Ostadabbas, berkata apabila cahaya melalui tingkap penghantaran ini, A-Eye memproses warna menjadi data. Dan model pembelajaran mesin terbina dalam mencari corak untuk mengenal pasti warna sepadan yang dianalisis oleh A-Eye dengan lebih baik.
Pada masa yang sama, A-Eye juga boleh terus meningkatkan hasil anggaran warna dengan menambahkan sebarang tekaan yang betul pada set data latihannya.
Davoud Hejazi, salah seorang pengarang pertama kajian ini, kini merupakan saintis data kanan di Titan Advanced Energy Solutions, memfokuskan pada pemodelan statistik, pembelajaran mesin, isyarat pemprosesan, pemprosesan imej, pengkomputeran awan dan Visualisasi data dan bidang lain.
Pada bulan Mei tahun ini, beliau memperoleh Ph.D dalam bidang fizik dari Universiti Timur Laut adalah "Anggaran Warna Tepat Tanpa Penyebaran menggunakan Bahan 2D Excitonic Berlapis dan Pembelajaran Mesin". .
Alamat kertas: https://repository.library.northeastern.edu/files/neu:4f171c96c
Atas ialah kandungan terperinci Menggunakan bahan 2D dan pembelajaran mesin yang unik, CV "melihat" berjuta-juta warna seperti manusia. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!