首頁 >後端開發 >Python教學 >FastMRZ 簡介 – 輕鬆輕鬆擷取 MRZ

FastMRZ 簡介 – 輕鬆輕鬆擷取 MRZ

Susan Sarandon
Susan Sarandon原創
2025-01-04 12:51:41577瀏覽

Introducing FastMRZ – Effortless MRZ Extraction Made Simple

概述

在速度就是一切的當今世界,敏感文檔處理必須自動化。無論是護照、簽證或身分證,準確、快速地提取機讀區資料對於開發可靠的應用程式非常重要。這就是 fastmrz 作為輕量級且高效的 Python 套件發揮作用的地方,它使從文件圖像中提取 MRZ 資料變得更加容易。

GitHub 儲存庫: FastMRZ 儲存庫

PyPI: FastMRZ Python 套件

什麼是 FastMRZ?

FastMRZ 是一個 Python 套件,它使用電腦視覺技術從文件映像中提取 MRZ 資訊。它提供了一個易於使用的實現,可以提取機讀區,使開發人員能夠更輕鬆地建立金融科技、安全和身份驗證系統。

為什麼要使用 FastMRZ?

1。易於使用: 透過簡單的 API,fastmrz 可以讓您立即啟動並運行,並且不需要陡峭的學習曲線。

2。速度: 針對效能進行了最佳化,它處理影像的速度足夠快,以確保應用程式中的延遲最小。

3。準確性: 它旨在可靠地檢測和提取 MRZ 數據,即使在具有挑戰性的影像條件下也是如此。

4。輕量級: 它的建構是為了將依賴關係保持在最低限度,因此可以輕鬆整合到任何專案中。

5。開源:它是免費且開源的,因此社群貢獻並改進了該軟體包。

還有這個 python 包,

  • 支援多種文件格式(護照、簽證、身分證)。
  • 相容於多種影像解析度和格式。
  • 對傾斜或扭曲的影像具有穩健性。
  • 用於無縫整合的Pythonic API。

主要特點

FastMRZ 在許多方面都是獨一無二的,結合了強大的功能:

1。智慧型機讀區偵測:此程式庫應用複雜的輪廓偵測方法,以便找到文件影像中機讀區區域的準確位置,以便即使文件方向不完美也能準確擷取。

2。自訂 ONNX 模型:我們整合了我們自己的、客製化訓練的 ONNX 模型,透過利用機器學習的力量,同時保持快速的速度來提高識別準確性。

3。內建驗證:它具有全面的校驗和邏輯,可驗證提取的數據,幫助發現任何潛在的識別錯誤或文件篡改。

4。靈活的輸出格式:無論是便於與其他系統整合的結構化 JSON,還是用於簡單處理的原始文本,FastMRZ 都能滿足您的需求。

引擎蓋下

FastMRZ 建立在非常強大的技術基礎上,使用了多項領先技術:

  • OpenCV 用於影像處理和 MRZ 區域檢測
  • Tesseract OCR 用於文字識別,具有針對 MRZ 特定字元的自訂訓練資料
  • NumPy 用於高效率的數值運算
  • ONNX 用於執行最佳化的機器學習模型。

用法

安裝

您可以透過pip安裝fastmrz:

pip install fastmrz  

如何使用 fastmrz

這是一個快速入門範例:

from fastmrz import FastMRZ
import json

fast_mrz = FastMRZ()

passport_mrz = fast_mrz.get_mrz("../data/passport_uk.jpg")
print("JSON:")
print(json.dumps(passport_mrz, indent=4))

print("\n")

passport_mrz = fast_mrz.get_mrz("../data/passport_uk.jpg", raw=True)
print("TEXT:")
print(passport_mrz)

輸出:

JSON:
{
    "mrz_type": "TD3",
    "document_type": "P",
    "country_code": "GBR",
    "surname": "PUDARSAN",
    "given_name": "HENERT",
    "document_number": "707797979",
    "nationality": "GBR",
    "date_of_birth": "1995-05-20",
    "sex": "M",
    "date_of_expiry": "2017-04-22",
    "status": "SUCCESS"
}


TEXT:
P<GBRPUDARSAN<<HENERT<<<<<<<<<<<<<<<<<<<<<<<
7077979792GBR9505209M1704224<<<<<<<<<<<<<<00

了解機讀區類型

FastMRZ 支援各種 MRZ 格式,包括:

  • 身分證中常用的TD-1格式(3行,每行30個字元)
  • TD-2 格式(2 行,每行 36 個字元)在一些簽證和舊身分證中發現
  • TD-3 格式(2 行,每行 44 個字元)用於國際護照

該程式庫會自動偵測格式並進行相應處理,使其適用於不同的文件類型。

應用領域

  • 身份驗證:自動化安全和旅行中的身份驗證流程。
  • 金融科技:透過無縫文件驗證增強 KYC 流程。
  • 旅行和移民:簡化護照和簽證的資料收集。
  • 政府申請:協助邊境管制和其他監管活動。

結論

FastMRZ 可提高文件處理的可存取性和效率。無論是實施邊境管制系統、開發身份驗證軟體或任何文件處理應用程式 - 借助 FastMRZ 的強大功能,絕對可以放心地完成機讀區提取。

如果您覺得有用,您可以在 GitHub 上分叉該專案並為其加註星標。您的星星有助於推動這個開源工具的持續發展。

以上是FastMRZ 簡介 – 輕鬆輕鬆擷取 MRZ的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn