Rumah >Peranti teknologi >AI >Meneroka Visi Komputer (CV): Maksud, Prinsip, Aplikasi dan Penyelidikan

Meneroka Visi Komputer (CV): Maksud, Prinsip, Aplikasi dan Penyelidikan

王林
王林ke hadapan
2024-01-23 16:30:171537semak imbas

Meneroka Visi Komputer (CV): Maksud, Prinsip, Aplikasi dan Penyelidikan

Computer vision (CV) ialah bidang kecerdasan buatan (AI) yang bertujuan untuk membolehkan komputer meniru sistem visual manusia untuk lebih memahami dan mentafsir kandungan imej dan video digital. Proses ini terutamanya melibatkan pemerolehan imej, saringan, analisis, pengecaman dan pengekstrakan maklumat. Boleh dikatakan AI memberi komputer keupayaan untuk berfikir, manakala CV memberi mereka keupayaan untuk memerhati dan memahami.

Nilai penglihatan komputer

Sistem penglihatan komputer dilatih dan dioptimumkan untuk menganalisis sejumlah besar produk atau proses dalam masa nyata dan membantu mengenal pasti masalah. Kelajuan, objektiviti, kesinambungan, ketepatan dan skalabilitinya melebihi keupayaan manusia. Ia dapat memeriksa produk, memerhati infrastruktur atau proses pengeluaran, dan melakukan analisis masa nyata. Aplikasi teknologi ini menjadikan penemuan masalah lebih cekap dan tepat.

Model pembelajaran mendalam visi komputer terkini menunjukkan ketepatan dan prestasi luar biasa dalam tugas pengecaman imej dunia sebenar. Model ini telah mencapai kejayaan yang ketara dalam pengecaman muka, pengesanan objek dan klasifikasi imej. Dengan kemajuan teknologi, visi komputer telah digunakan secara meluas dalam pelbagai industri. Ia memainkan peranan penting dalam keselamatan dan pengimejan perubatan, pembuatan, automotif, pertanian, pembinaan, bandar pintar, pengangkutan dan banyak lagi. Selain itu, dengan perkembangan teknologi yang berterusan, penglihatan komputer telah menjadi lebih fleksibel dan berskala, yang juga membawa kemungkinan kes aplikasi yang lebih praktikal.

Menurut anggaran media yang berkaitan, pasaran visi komputer akan mencecah AS$144 bilion menjelang 2028.

Langkah dan Prinsip Kerja Visi Komputer

Mari kita fahami langkah kerja asas penglihatan komputer:

Langkah 1, pemerolehan imej, kamera atau penderia imej memasukkan digital

Langkah 2, prapemprosesan, input imej asal perlu dipraproses untuk mengoptimumkan prestasi tugas penglihatan komputer berikutnya. Prapemprosesan termasuk pengurangan hingar, peningkatan kontras, penskalaan semula atau pemangkasan imej.

Langkah 3, pemprosesan algoritma, algoritma penglihatan komputer melaksanakan pengesanan objek, pembahagian imej dan pengelasan pada setiap bingkai imej atau video.

Langkah 4, pemprosesan peraturan, maklumat output perlu diproses mengikut peraturan keadaan use case. Bahagian ini melakukan automasi berdasarkan maklumat yang diperoleh daripada tugas penglihatan komputer.

Mari kita lihat cara penglihatan komputer berfungsi:

Sistem penglihatan komputer moden menggabungkan pemprosesan imej, pembelajaran mesin dan teknologi pembelajaran mendalam, bergantung pada pengecaman corak dan pembelajaran mendalam untuk melatih diri dan memahami data visual. Penglihatan komputer tradisional menggunakan pembelajaran mesin, tetapi kini kaedah pembelajaran mendalam telah berkembang menjadi penyelesaian yang lebih baik dalam bidang ini.

Banyak kaedah berprestasi tinggi dalam aplikasi penglihatan komputer moden adalah berdasarkan rangkaian neural konvolusi (CNN). Rangkaian saraf berlapis ini membolehkan komputer memahami data imej secara kontekstual. Memandangkan data yang mencukupi, komputer belajar cara membezakan antara imej. Apabila data imej melalui model, komputer menggunakan CNN untuk melihat data. CNN membantu model pembelajaran mendalam memahami imej dengan memecahkannya kepada piksel, yang diberi label untuk melatih ciri tertentu, yang dipanggil anotasi imej. Model melakukan konvolusi menggunakan label dan membuat ramalan tentang perkara yang dilihatnya, dan secara berulang menyemak ketepatan ramalan sehingga ramalan adalah seperti yang dijangkakan. Pembelajaran mendalam bergantung pada rangkaian saraf dan menggunakan contoh untuk menyelesaikan masalah. Ia belajar sendiri dengan menggunakan data berlabel untuk mengenal pasti kes penggunaan biasa dalam contoh.

Bidang Aplikasi Penglihatan Komputer

Pembuatan: Penglihatan komputer industri digunakan dalam pembuatan untuk mengautomasikan pemeriksaan produk, pengiraan objek, automasi proses dan meningkatkan keselamatan pekerja melalui pengesanan PPE dan pengesanan topeng.

Penjagaan kesihatan: Antara aplikasi penglihatan komputer dalam penjagaan kesihatan, contoh yang ketara ialah pengesanan kejatuhan manusia automatik untuk mencipta skor risiko jatuh dan mencetuskan amaran.

Keselamatan: Dalam pengawasan dan keselamatan video, pengesanan kakitangan dilakukan untuk mencapai pemantauan perimeter pintar.

Pertanian: Kes penggunaan penglihatan pengiraan dalam pertanian adalah untuk memantau haiwan secara automatik dan mengesan penyakit dan keabnormalan haiwan lebih awal.

Bandar Pintar: Penglihatan komputer digunakan di bandar pintar untuk analisis orang ramai, analisis trafik, pengiraan kenderaan dan pemeriksaan infrastruktur.

Runcit: Video daripada kamera pengawasan kedai runcit boleh digunakan untuk menjejaki corak pergerakan pelanggan untuk pengiraan orang atau analisis trafik pejalan kaki.

Insurans: Visi komputer dalam insurans memanfaatkan visi AI untuk pengurusan dan penilaian risiko automatik, pengurusan tuntutan dan analisis yang berpandangan ke hadapan.

Logistik: Automasi untuk menjimatkan kos dengan mengurangkan kesilapan manusia, penyelenggaraan ramalan dan mempercepatkan operasi di seluruh rantaian bekalan.

Farmaseutikal: Penglihatan komputer dalam industri farmaseutikal digunakan untuk pemeriksaan visual pemeriksaan pembungkusan, pengenalan kapsul dan pembersihan peralatan.

Arah Penyelidikan Visi Komputer

Pengecaman objek: Tentukan sama ada data imej mengandungi satu atau lebih objek yang ditentukan atau dipelajari atau kelas objek.

Pengecaman Wajah: Kenal pasti wajah dengan memadankannya dengan pangkalan data.

Pengesanan Objek: Analisis data imej untuk keadaan tertentu dan cari objek semantik kelas tertentu.

Anggaran pose: Menganggar arah relatif dan kedudukan objek tertentu.

Pengecaman Aksara Optik: Mengecam aksara dalam imej, selalunya digabungkan dengan pengekodan teks.

Pemahaman Adegan: Menghuraikan imej ke dalam segmen yang bermakna untuk analisis.

Analisis Pergerakan: Jejaki pergerakan tempat menarik atau objek dalam jujukan imej atau video.

Atas ialah kandungan terperinci Meneroka Visi Komputer (CV): Maksud, Prinsip, Aplikasi dan Penyelidikan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:163.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam