ホームページ >バックエンド開発 >Python チュートリアル >FastMRZ の紹介 – 簡単な MRZ 抽出を簡単に

FastMRZ の紹介 – 簡単な MRZ 抽出を簡単に

Susan Sarandon
Susan Sarandonオリジナル
2025-01-04 12:51:41581ブラウズ

Introducing FastMRZ – Effortless MRZ Extraction Made Simple

概要

スピードがすべてである今日の世界では、機密文書の処理を自動化する必要があります。パスポート、ビザ、ID カードのいずれであっても、MRZ データを正確かつ迅速に抽出することは、信頼性の高いアプリケーションを開発するために非常に重要です。ここで、軽量で効率的な Python パッケージとして fastmrz が登場し、ドキュメント画像からの MRZ データ抽出がはるかに簡単になります。

GitHub リポジトリ: FastMRZ リポジトリ

PyPI: FastMRZ Python パッケージ

FastMRZとは何ですか?

FastMRZ は、コンピューター ビジョン技術を使用してドキュメントの画像から MRZ 情報を抽出する Python パッケージです。 MRZ の抽出を可能にする使いやすい実装を提供し、FinTech、セキュリティ、本人確認のためのシステムを構築する開発者を容易にします。

FastMRZ を使用する理由

1.使いやすさ: シンプルな API を使用する fastmrz は、すぐに使い始められ、急な学習曲線は必要ありません。

2.速度: パフォーマンスのために最適化されており、アプリケーションの遅延を最小限に抑えるのに十分な速度で画像を処理します。

3.精度: 困難な画像条件であっても、MRZ データを確実に検出して抽出できるように設計されています。

4.軽量: 依存関係を最小限に抑えるように構築されているため、あらゆるプロジェクトに簡単に統合できます。

5.オープンソース: 無料でオープンソースであるため、コミュニティがパッケージに貢献し、改善しています。

この Python パッケージも、

  • さまざまな文書形式 (パスポート、ビザ、ID カード) をサポートします。
  • 幅広い画像解像度と形式と互換性があります。
  • 画像の歪みや歪みに対して堅牢です。
  • シームレスな統合のための Python API。

主な特長

FastMRZ は、強力な機能を組み合わせた多くの点でユニークです:

1.インテリジェントな MRZ 検出: ライブラリは高度な輪郭検出方法を適用して、文書画像内の MRZ 領域の正確な位置を見つけ、文書の方向が完全でない場合でも正確に抽出します。

2.カスタム ONNX モデル: 高速な速度を維持しながら機械学習の力を利用することで認識精度を向上させるために、独自のカスタム トレーニングされた ONNX モデルを統合しました。

3.組み込みの検証: 抽出されたデータを検証する包括的なチェックサム ロジックを備えており、潜在的な認識エラーや文書の改ざんを検出するのに役立ちます。

4.柔軟な出力形式: 他のシステムと簡単に統合できる構造化 JSON であっても、単純な処理のための生のテキストであっても、FastMRZ は対応します。

ボンネットの下で

FastMRZ は、いくつかの主要なテクノロジーを使用した、非常に堅牢な技術基盤に基づいて構築されています。

  • 画像処理と MRZ 領域検出のための OpenCV
  • テキスト認識用の Tesseract OCR、MRZ 固有の文字のカスタム トレーニング データを使用
  • NumPy による効率的な数値演算
  • ONNX は、最適化された機械学習モデルを実行します。

使用法

インストール

pip 経由で fastmrz をインストールできます:

pip install fastmrz  

fastmrzの使用方法

始めるための簡単な例を次に示します:

from fastmrz import FastMRZ
import json

fast_mrz = FastMRZ()

passport_mrz = fast_mrz.get_mrz("../data/passport_uk.jpg")
print("JSON:")
print(json.dumps(passport_mrz, indent=4))

print("\n")

passport_mrz = fast_mrz.get_mrz("../data/passport_uk.jpg", raw=True)
print("TEXT:")
print(passport_mrz)

出力:

JSON:
{
    "mrz_type": "TD3",
    "document_type": "P",
    "country_code": "GBR",
    "surname": "PUDARSAN",
    "given_name": "HENERT",
    "document_number": "707797979",
    "nationality": "GBR",
    "date_of_birth": "1995-05-20",
    "sex": "M",
    "date_of_expiry": "2017-04-22",
    "status": "SUCCESS"
}


TEXT:
P<GBRPUDARSAN<<HENERT<<<<<<<<<<<<<<<<<<<<<<<
7077979792GBR9505209M1704224<<<<<<<<<<<<<<00

MRZ タイプを理解する

FastMRZ は、次のようなさまざまな MRZ フォーマットをサポートします。

  • TD-1 形式 (3 行、各 30 文字) ID カードで一般的に使用される
  • TD-2 形式 (2 行、各 36 文字) 一部のビザおよび古い ID にあります
  • TD-3 形式 (2 行、各 44 文字) 国際パスポートで使用されます

ライブラリは形式を自動的に検出し、それに応じて処理するため、さまざまな種類のドキュメントに多用途に対応できます。

アプリケーション

  • 本人確認: セキュリティと旅行における ID 確認プロセスを自動化します。
  • フィンテック: シームレスな文書検証により KYC プロセスを強化します。
  • 旅行と入国管理: パスポートとビザのデータ収集を合理化します。
  • 政府への申請: 国境警備およびその他の規制活動を支援します。

結論

FastMRZ により、ドキュメント処理のアクセシビリティと効率が向上します。国境管理システムの実装であれ、本人確認ソフトウェアでの作業であれ、文書処理アプリケーションであれ、MRZ 抽出は FastMRZ の力を使用することで確実に確実に行われます。

役立つと思われる場合は、GitHub でプロジェクトをフォークしてスターを付けることができます。あなたのスターは、このオープンソース ツールの継続的な開発を促進するのに役立ちます。

以上がFastMRZ の紹介 – 簡単な MRZ 抽出を簡単にの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。