Heim >Backend-Entwicklung >Python-Tutorial >Wie erstellt man einen Dokumentenscanner in Python?

Wie erstellt man einen Dokumentenscanner in Python?

王林nach vorne: 2023-04-26 13:10:111818Durchsuche

Übersetzer |. Bugatti

Rezensent |. Vielleicht möchten Sie Dokumente digitalisieren, um physischen Platz zu sparen oder Backups zu erstellen. Auf jeden Fall ist das Schreiben eines Programms zum Konvertieren von Fotos von Papierdokumenten in ein Quasiformat genau das, worin Python gut ist.

Durch die Kombination mehrerer geeigneter Bibliotheken können Sie eine kleine Anwendung zum Digitalisieren von Dokumenten erstellen. Ihr Programm nimmt ein Bild eines physischen Dokuments als Eingabe, wendet verschiedene Bildverarbeitungstechniken darauf an und gibt eine gescannte Version der Eingabe aus.

1. Bereiten Sie die Umgebung vor

Zunächst sollten Sie mit den Grundlagen von Python vertraut sein und auch wissen, wie man die NumPy-Python-Bibliothek verwendet.

Öffnen Sie eine beliebige Python-IDE und erstellen Sie zwei Python-Dateien. Benennen Sie eine main.py und die andere transform.py. Führen Sie dann den folgenden Befehl auf dem Terminal aus, um die erforderlichen Bibliotheken zu installieren.

pip install OpenCV-Python imutils scikit-image NumPy

Sie werden OpenCV-Python verwenden, um eine Bildeingabe zu übernehmen und etwas Bildverarbeitung durchzuführen, Imutils verwenden, um die Größe der Eingabe- und Ausgabebilder zu ändern, und scikit-image verwenden, um die Bilder mit einem Schwellenwert zu versehen. NumPy hilft Ihnen bei Arrays.

Wie erstellt man einen Dokumentenscanner in Python? Warten Sie, bis die Installation abgeschlossen ist und die IDE das Projekt-Backbone aktualisiert. Sobald der Backbone-Inhalt aktualisiert ist, können Sie mit der Programmierung beginnen. Der vollständige Quellcode ist im GitHub-Repository zu finden.

2. Importieren Sie die installierte Bibliothek.

Öffnen Sie die Datei main.py und importieren Sie die installierte Bibliothek. Dadurch können Sie deren Funktionen bei Bedarf aufrufen und nutzen.

import cv2
import imutils
from skimage.filters import threshold_local
from transform import perspective_transform

Fehler ignorieren, die von perspective_transform ausgelöst werden. Sobald Sie die Verarbeitung der transform.py-Datei abgeschlossen haben, verschwindet der Fehler.

3. Rufen Sie die Eingabe ab und ändern Sie ihre Größe.

Machen Sie ein klares Bild des Dokuments, das Sie scannen möchten. Stellen Sie sicher, dass alle vier Ecken des Dokuments und seines Inhalts sichtbar sind. Kopieren Sie das Bild in denselben Ordner, in dem die Programmdateien gespeichert sind.

Wie erstellt man einen Dokumentenscanner in Python? Übergeben Sie den Eingabebildpfad an OpenCV. Erstellen Sie eine Kopie des Originalbildes, da Sie diese während der Perspektivtransformation benötigen. Teilen Sie die Höhe des Originalbilds durch die Höhe, auf die Sie die Größe ändern möchten. Dadurch bleibt das Seitenverhältnis erhalten. Abschließend wird das angepasste Bild ausgegeben.

# Passing the image path
original_img = cv2.imread('sample.jpg')
copy = original_img.copy()

# The resized height in hundreds
ratio = original_img.shape[0] / 500.0
img_resize = imutils.resize(original_img, height=500)

# Displaying output
cv2.imshow('Resized image', img_resize)

# Waiting for the user to press any key
cv2.waitKey(0)

Die Ausgabe des obigen Codes ist wie folgt:

Wie erstellt man einen Dokumentenscanner in Python? Jetzt haben Sie die Höhe des Originalbilds auf 500 Pixel angepasst.

4. Konvertieren Sie das angepasste Bild in ein Graustufenbild.