Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk menggunakan teknologi pengecaman imej dalam Python?

Bagaimana untuk menggunakan teknologi pengecaman imej dalam Python?

王林
王林asal
2023-06-06 08:03:097478semak imbas

Dalam bidang teknologi kontemporari, teknologi pengecaman imej menjadi semakin penting. Teknologi pengecaman imej membantu kami mengenal pasti dan mengklasifikasikan entiti yang diekstrak daripada imej digital, yang kemudiannya digunakan dalam analisis dan ramalan data. Python ialah bahasa pengaturcaraan yang sangat popular yang juga sesuai untuk bekerja dengan teknologi pengecaman imej. Dalam artikel ini, kita akan belajar cara menggunakan teknologi pengecaman imej dalam Python dan perkara yang boleh kita lakukan dengannya.

1. Pustaka pemprosesan imej

Sebelum mula menggunakan teknologi pengecaman imej, adalah lebih baik untuk memahami beberapa pengetahuan asas perpustakaan pemprosesan imej. Pustaka pemprosesan imej yang paling biasa digunakan dalam Python termasuk OpenCV, Pillow, dan Scikit-image. Dalam artikel ini, kami akan memberi tumpuan kepada menggunakan dua perpustakaan, OpenCV dan Scikit-image.

2. OpenCV

OpenCV ialah perpustakaan penglihatan komputer sumber terbuka yang boleh digunakan pada platform yang berbeza. OpenCV menyediakan sejumlah besar algoritma dan fungsi yang boleh digunakan untuk melaksanakan pemprosesan imej digital, analisis dan penglihatan komputer. Berikut ialah langkah asas untuk pengecaman imej menggunakan OpenCV:

1 Pasang OpenCV

Sebelum anda mula menggunakan OpenCV, anda perlu memasangnya pada komputer anda. Pustaka OpenCV boleh dipasang melalui arahan pip dan conda. Pada Windows, anda boleh memasangnya dengan arahan berikut:

pip install opencv-python

Sebagai alternatif, anda boleh menggunakan conda untuk memasang OpenCV:

conda install -c conda-forge opencv

2. Muatkan imej

Seterusnya, anda perlu memuatkan imej yang anda ingin menganalisis imej. Dalam Python, anda boleh memuatkan satu imej atau berbilang imej menggunakan fungsi OpenCV cv2.imread().

import cv2

# load an image
image = cv2.imread("path/to/image")

3. Praproses imej

Sebelum menggunakan OpenCV, imej perlu dipraproses. Pemprosesan berikut boleh dilakukan pada imej:

# convert the image to grayscale
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

# apply a Gaussian blur to remove noise
blurred = cv2.GaussianBlur(gray, (5, 5), 0)

# apply edge detection to extract edges
edges = cv2.Canny(blurred, 50, 200)

4. Kenal pasti objek

Setelah imej telah dipraproses, objek boleh dikenal pasti menggunakan algoritma dan fungsi OpenCV. Objek boleh ditandakan sebagai segi empat tepat atau bulatan, dsb.

# perform an object detection
(contours, _) = cv2.findContours(edges.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
for c in contours:
    # compute the bounding box of the object
    (x, y, w, h) = cv2.boundingRect(c)

    # draw the bounding box around the object
    cv2.rectangle(image, (x, y), (x + w, y + h), (0, 255, 0), 2)

5. Paparkan hasil

Gunakan OpenCV untuk memaparkan imej yang diproses.

# display the result
cv2.imshow("Object Detection", image)
cv2.waitKey(0)

3. Scikit-image

Scikit-image ialah perpustakaan pemprosesan imej berdasarkan bahasa Python Ia juga menyediakan banyak algoritma dan fungsi pemprosesan imej. Berikut ialah langkah asas untuk pengecaman imej menggunakan Scikit-image:

1 Pasang Scikit-image

Anda boleh menggunakan arahan berikut untuk memasang pustaka imej Scikit:

rreee.

2 .Muat Imej

Begitu juga, sebelum menggunakan Scikit-image, anda perlu memuatkan imej yang ingin anda analisis.

pip install scikit-image

3. Praproses imej

Sebelum menggunakan Scikit-image, anda juga perlu praproses imej. Pemprosesan berikut boleh dilakukan pada imej:

from skimage import io

# load the image
image = io.imread("path/to/image")

4 Kenal pasti objek

Gunakan algoritma dan fungsi Scikit-image untuk mengenal pasti objek dan menandakan objek sebagai segi empat tepat atau bulatan, dsb.

from skimage.filters import threshold_local
from skimage.color import rgb2gray

# convert the image to grayscale
gray = rgb2gray(image)

# apply a threshold to the image
thresh = threshold_local(gray, 51, offset=10)

5. Paparkan hasil

Gunakan Scikit-image untuk memaparkan imej yang diproses.

from skimage import measure
from skimage.color import label2rgb
from skimage.draw import rectangle

# find contours in the image
contours = measure.find_contours(thresh, 0.8)

# draw a rectangle around each object
for n, contour in enumerate(contours):
    row_min, col_min = contour.min(axis=0)
    row_max, col_max = contour.max(axis=0)
    rect = rectangle((row_min, col_min), (row_max, col_max), shape=image.shape)
    image[rect] = 0

Kesimpulan

Melalui artikel ini, kami mempelajari cara menggunakan OpenCV dan Scikit-image dalam Python untuk pengecaman imej. Kedua-dua perpustakaan ini ialah salah satu perpustakaan pemprosesan imej paling popular dalam Python dan boleh membantu kami dengan pemprosesan imej, analisis dan penglihatan komputer. Menggunakan teknologi pengecaman imej, entiti yang tidak kelihatan boleh diekstrak dengan mudah daripada imej digital dan digunakan dalam analisis dan ramalan data, contohnya, ia boleh digunakan untuk perubatan, keselamatan dan kewangan. Walaupun artikel ini menyediakan beberapa kaedah penggunaan asas, teknologi pengecaman imej adalah bidang yang sangat kompleks dan pelbagai, dan terdapat banyak algoritma dan teknik lain yang boleh digunakan. Oleh itu, mempelajari dan meneroka bidang ini adalah satu proses yang sangat menarik dan berbaloi.

Atas ialah kandungan terperinci Bagaimana untuk menggunakan teknologi pengecaman imej dalam Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn