Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk membina pengimbas dokumen dalam Python?

Bagaimana untuk membina pengimbas dokumen dalam Python?

王林ke hadapan: 2023-04-26 13:10:111854semak imbas

Penterjemah |. Bugatti

Penyemak |. Walau apa pun, menulis atur cara untuk menukar foto dokumen kertas kepada format separa adalah apa yang Python mahir.

Menggunakan gabungan perpustakaan yang sesuai, anda boleh membina aplikasi kecil untuk mendigitalkan dokumen. Program anda akan mengambil imej dokumen fizikal sebagai input, menggunakan beberapa teknik pemprosesan imej padanya dan mengeluarkan versi input yang diimbas.

1. Sediakan persekitaran

Pertama sekali, anda harus biasa dengan asas Python, dan anda juga perlu tahu cara menggunakan perpustakaan NumPy Python .

Buka mana-mana IDE Python dan buat dua fail Python. Namakan satu main.py dan satu lagi transform.py. Kemudian laksanakan arahan berikut pada terminal untuk memasang perpustakaan yang diperlukan.

Anda akan menggunakan OpenCV-Python untuk mengambil input imej dan melakukan beberapa pemprosesan imej, menggunakan Imutils untuk mengubah saiz imej input dan output, dan menggunakan imej scikit untuk ambang imej. NumPy akan membantu anda dengan tatasusunan.

pip install OpenCV-Python imutils scikit-image NumPy

Bagaimana untuk membina pengimbas dokumen dalam Python? Tunggu pemasangan selesai dan IDE mengemas kini tulang belakang projek. Setelah kandungan tulang belakang dikemas kini, anda boleh memulakan pengaturcaraan. Kod sumber lengkap boleh didapati dalam repositori GitHub.

2. Import pustaka yang dipasang

Buka fail main.py dan import pustaka yang dipasang. Ini akan membolehkan anda memanggil dan menggunakan fungsi mereka apabila perlu.

Abaikan ralat yang dilemparkan oleh perspective_transform. Setelah anda selesai memproses fail transform.py, ralat akan hilang.

import cv2
import imutils
from skimage.filters import threshold_local
from transform import perspective_transform

3. Dapatkan dan ubah saiz input

Ambil imej yang jelas bagi dokumen yang ingin anda imbas. Pastikan keempat-empat penjuru dokumen dan kandungannya kelihatan. Salin imej ke folder yang sama di mana fail program disimpan.

Bagaimana untuk membina pengimbas dokumen dalam Python? Lulus laluan imej input ke OpenCV. Buat salinan imej asal kerana anda memerlukannya semasa transformasi perspektif. Bahagikan ketinggian imej asal dengan ketinggian yang anda mahu ubah saiznya. Ini akan mengekalkan nisbah aspek. Akhirnya, imej yang dilaraskan adalah output.

Keluaran kod di atas adalah seperti berikut:

# Passing the image path
original_img = cv2.imread('sample.jpg')
copy = original_img.copy()

# The resized height in hundreds
ratio = original_img.shape[0] / 500.0
img_resize = imutils.resize(original_img, height=500)

# Displaying output
cv2.imshow('Resized image', img_resize)

# Waiting for the user to press any key
cv2.waitKey(0)

Bagaimana untuk membina pengimbas dokumen dalam Python? Kini anda Ketinggian imej asal telah dilaraskan kepada 500 piksel.

4. Tukar imej yang dilaraskan kepada imej skala kelabu