Rumah >Peranti teknologi >AI >Para saintis membangunkan cermin mata sonar kecerdasan buatan yang boleh mengenali bacaan bibir dengan ketepatan 95%
Penyelidik di Universiti Cornell di Amerika Syarikat telah membangunkan teknologi baharu yang membolehkan komunikasi senyap melalui cermin mata sonar. Cermin mata menggunakan pembesar suara dan mikrofon kecil untuk membaca perkataan yang diucapkan secara senyap oleh pemakai, membolehkan mereka melakukan pelbagai tugas tanpa memerlukan input fizikal.
Teknologi ini dibangunkan di bawah pimpinan Zhang Ruidong (transliterasi), pelajar kedoktoran di Cornell University, dan merupakan peningkatan berdasarkan projek serupa yang menggunakan set kepala wayarles , manakala model terdahulu bergantung pada kamera.
Menurut IT House, cermin mata sonar menggunakan antara muka pengecaman pertuturan senyap yang dipanggil EchoSpeech, yang menggunakan sonar untuk mengesan pergerakan mulut dan menggunakan algoritma pembelajaran mendalam untuk menganalisis ciri gema dalam masa nyata. Ini membolehkan sistem mengenali perkataan yang diucapkan secara senyap oleh pemakai dengan ketepatan kira-kira 95%.
Salah satu prospek yang paling menarik bagi teknologi ini ialah orang yang mengalami masalah pertuturan boleh menggunakannya untuk menyuap perbualan secara senyap ke dalam pensintesis pertuturan dan kemudian menyebut perkataan itu dengan lantang. Cermin mata juga boleh digunakan untuk mengawal main balik muzik di perpustakaan yang tenang atau menentukan maklumat pada konsert yang kuat.
Teknologi ini kecil dan berkuasa rendah serta tidak menceroboh privasi kerana tiada data meninggalkan telefon pengguna. Dengan cara ini, tiada kebimbangan privasi. Cermin mata ini sangat mudah dipakai dan lebih praktikal dan boleh dilaksanakan daripada teknologi pengecaman pertuturan senyap lain yang tersedia.
Penyelidik mengatakan sistem hanya memerlukan beberapa minit data latihan untuk mempelajari corak pertuturan pengguna Setelah pembelajaran selesai, ia boleh menghantar dan menerima gelombang bunyi ke arah muka pengguna, merasakan pergerakan mulut dan menggunakan kedalaman pada. pada masa yang sama Algoritma pembelajaran menganalisis ciri gema. Sistem pada masa ini dapat mengenali 31 arahan terpencil dan urutan nombor berturut-turut dengan kadar ralat kurang daripada 10%.
Versi semasa sistem menawarkan lebih kurang 10 jam hayat bateri dan boleh berkomunikasi secara wayarles dengan telefon pintar pengguna melalui Bluetooth. Telefon pintar memproses dan meramalkan semua data dan menghantar hasilnya kepada beberapa "kunci tindakan" yang membolehkannya memainkan muzik, berinteraksi dengan peranti pintar atau mengaktifkan pembantu suara.
Makmal Antara Muka Komputer Pintar untuk Interaksi Masa Hadapan (SciFi) Cornell University memanfaatkan program pembiayaan Cornell untuk meneroka kemungkinan mengkomersialkan teknologi ini.
Atas ialah kandungan terperinci Para saintis membangunkan cermin mata sonar kecerdasan buatan yang boleh mengenali bacaan bibir dengan ketepatan 95%. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!