Heim >Backend-Entwicklung >Python-Tutorial >Wir stellen vor: FastMRZ – mühelose MRZ-Extraktion leicht gemacht

Wir stellen vor: FastMRZ – mühelose MRZ-Extraktion leicht gemacht

Susan Sarandon
Susan SarandonOriginal
2025-01-04 12:51:41581Durchsuche

Introducing FastMRZ – Effortless MRZ Extraction Made Simple

Überblick

In der heutigen Welt, in der Geschwindigkeit alles ist, muss die Verarbeitung sensibler Dokumente automatisiert werden. Ob Reisepass, Visum oder Personalausweis – die genaue und schnelle Extraktion von MRZ-Daten ist für die Entwicklung zuverlässiger Anwendungen von großer Bedeutung. Hier kommt fastmrz als leichtes und effizientes Python-Paket ins Spiel, das die MRZ-Datenextraktion aus Dokumentbildern erheblich vereinfacht.

GitHub Repository: FastMRZ Repo

PyPI: FastMRZ Python-Paket

Was ist FastMRZ?

FastMRZ ist ein Python-Paket, das Computer-Vision-Techniken verwendet, um MRZ-Informationen aus Bildern von Dokumenten zu extrahieren. Es bietet eine benutzerfreundliche Implementierung, die die Extraktion von MRZ ermöglicht und es Entwicklern erleichtert, die Systeme für FinTech, Sicherheit und Identitätsprüfung erstellen.

Warum FastMRZ verwenden?

1. Benutzerfreundlichkeit: Mit einer einfachen API sind Sie mit fastmrz im Handumdrehen einsatzbereit und erfordern keine steile Lernkurve.

2. Geschwindigkeit: Es ist auf Leistung optimiert und verarbeitet Bilder schnell genug, um die geringste Latenz in Ihren Anwendungen sicherzustellen.

3. Genauigkeit: Es ist darauf ausgelegt, MRZ-Daten auch bei schwierigen Bildbedingungen zuverlässig zu erkennen und zu extrahieren.

4. Leichtgewichtig: Es ist darauf ausgelegt, Abhängigkeiten auf ein Minimum zu beschränken und kann daher problemlos in jedes Projekt integriert werden.

5. Open Source: Es ist kostenlos und Open Source, daher leistet die Community einen Beitrag und verbessert das Paket.

Auch dieses Python-Paket,

  • Unterstützt verschiedene Dokumentenformate (Pässe, Visa, Personalausweise).
  • Kompatibel mit einer Vielzahl von Bildauflösungen und -formaten.
  • Robust gegen verzerrte oder verzerrte Bilder.
  • Pythonic-API für nahtlose Integration.

Hauptmerkmale

FastMRZ ist in vielerlei Hinsicht einzigartig mit der Kombination leistungsstarker Funktionen:

1. Intelligente MRZ-Erkennung: Die Bibliothek wendet hochentwickelte Konturerkennungsmethoden an, um die genaue Position des MRZ-Bereichs in Dokumentbildern zu finden und eine genaue Extraktion durchzuführen, selbst wenn die Dokumentausrichtung nicht perfekt ist.

2. Benutzerdefinierte ONNX-Modelle: Wir haben unsere eigenen, individuell trainierten ONNX-Modelle integriert, um die Erkennungsgenauigkeit zu verbessern, indem wir die Fähigkeiten des maschinellen Lernens nutzen und gleichzeitig hohe Geschwindigkeiten beibehalten.

3. Integrierte Validierung: Es verfügt über eine umfassende Prüfsummenlogik, die die extrahierten Daten überprüft und dabei hilft, mögliche Erkennungsfehler oder Dokumentmanipulationen zu erkennen.

4. Flexible Ausgabeformate: Ob strukturiertes JSON für die einfache Integration mit anderen Systemen oder sogar Rohtext für die einfache Verarbeitung, FastMRZ hat alles für Sie.

Unter der Haube

FastMRZ basiert auf einer sehr robusten technischen Grundlage und nutzt mehrere führende Technologien:

  • OpenCV für Bildverarbeitung und MRZ-Regionserkennung
  • Tesseract OCR zur Texterkennung, mit individuell trainierten Daten für MRZ-spezifische Zeichen
  • NumPy für effiziente numerische Operationen
  • ONNX zum Ausführen optimierter Modelle für maschinelles Lernen.

Verwendung

Installation

Sie können fastmrz über pip installieren:

pip install fastmrz  

So verwenden Sie fastmrz

Hier ist ein kurzes Beispiel für den Anfang:

from fastmrz import FastMRZ
import json

fast_mrz = FastMRZ()

passport_mrz = fast_mrz.get_mrz("../data/passport_uk.jpg")
print("JSON:")
print(json.dumps(passport_mrz, indent=4))

print("\n")

passport_mrz = fast_mrz.get_mrz("../data/passport_uk.jpg", raw=True)
print("TEXT:")
print(passport_mrz)

AUSGABE:

JSON:
{
    "mrz_type": "TD3",
    "document_type": "P",
    "country_code": "GBR",
    "surname": "PUDARSAN",
    "given_name": "HENERT",
    "document_number": "707797979",
    "nationality": "GBR",
    "date_of_birth": "1995-05-20",
    "sex": "M",
    "date_of_expiry": "2017-04-22",
    "status": "SUCCESS"
}


TEXT:
P<GBRPUDARSAN<<HENERT<<<<<<<<<<<<<<<<<<<<<<<
7077979792GBR9505209M1704224<<<<<<<<<<<<<<00

MRZ-Typen verstehen

FastMRZ unterstützt verschiedene MRZ-Formate, darunter:

  • TD-1-Format (3 Zeilen, jeweils 30 Zeichen), das häufig in Ausweisen verwendet wird
  • TD-2-Format (2 Zeilen, jeweils 36 Zeichen), das in einigen Visa und älteren Ausweisen zu finden ist
  • TD-3-Format (2 Zeilen, jeweils 44 Zeichen), das in internationalen Pässen verwendet wird

Die Bibliothek erkennt das Format automatisch und verarbeitet es entsprechend, wodurch es für verschiedene Dokumenttypen vielseitig einsetzbar ist.

Anwendungen

  • Identitätsüberprüfung:Automatisieren Sie Ausweisüberprüfungsprozesse im Sicherheits- und Reisebereich.
  • FinTech: Verbessern Sie KYC-Prozesse durch nahtlose Dokumentenüberprüfung.
  • Reisen und Einwanderung:Optimierte Datenerfassung für Pässe und Visa.
  • Regierungsanwendungen:Unterstützung bei der Grenzkontrolle und anderen regulatorischen Aktivitäten.

Abschluss

FastMRZ ermöglicht eine bessere Zugänglichkeit und Effizienz der Dokumentenverarbeitung. Sei es die Implementierung eines Grenzkontrollsystems, die Arbeit an Software zur Identitätsprüfung oder eine andere Anwendung zur Dokumentenverarbeitung – die MRZ-Extraktion wird mit der Leistungsfähigkeit von FastMRZ auf jeden Fall sicher durchgeführt.

Sie können das Projekt auf GitHub forken und markieren, wenn Sie es nützlich finden. Ihre Sterne tragen dazu bei, die Weiterentwicklung dieses Open-Source-Tools voranzutreiben.

Das obige ist der detaillierte Inhalt vonWir stellen vor: FastMRZ – mühelose MRZ-Extraktion leicht gemacht. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn