ホームページ >バックエンド開発 >Python チュートリアル >Python は Alibaba Cloud インターフェースを呼び出して OCR テキスト抽出機能を実装します

Python は Alibaba Cloud インターフェースを呼び出して OCR テキスト抽出機能を実装します

王林
王林オリジナル
2023-07-05 21:49:352039ブラウズ

Python は Alibaba Cloud インターフェイスを呼び出して OCR テキスト抽出機能を実装します

Alibaba Cloud は、OCR (光学文字認識) テキスト認識インターフェイスを含む一連の強力な API を提供します。このインターフェイスを通じて、画像内のテキストを識別できます。これは、紙文書内のテキストを電子テキストに変換するなど、一部のテキスト抽出シナリオに非常に適しています。

この記事では、Python で Alibaba Cloud の OCR インターフェイスを呼び出し、テキスト抽出機能を実装する方法を紹介します。具体的な手順は次のとおりです。

ステップ 1: Alibaba Cloud SDK のインストール

Alibaba Cloud の API インターフェイスを呼び出すには、まず対応する SDK をインストールする必要があります。 Python では、pip コマンドを通じて Alibaba Cloud SDK をインストールできます。

ターミナルを開いて次のコマンドを入力します:

pip install aliyun-python-sdk-core
pip install aliyun-python-sdk-ocr

ステップ 2: アクセス キーと秘密キーを取得する

Alibaba Cloud の API を呼び出すには、アクセス キーと秘密キーを指定する必要があります。秘密鍵 。これら 2 つの重要な情報は、Alibaba Cloud コンソールで申請して取得できます。これらの情報は両方とも安全な場所に保管してください。

ステップ 3: OCR インターフェイスを呼び出すコードを作成する

まず、関連するライブラリをインポートする必要があります:

import base64
import json
import urllib
import urllib.request
from aliyunsdkcore import client
from aliyunsdkocr.request.v20191230 import RecognizeCharacterRequest

次に、Alibaba Cloud クライアントを初期化します:

def create_aliyun_client():
    access_key = "<Your Access Key>"
    secret_key = "<Your Secret Key>"
    region_id = "cn-hangzhou"
    return client.AcsClient(access_key, secret_key, region_id)

次に、OCR インターフェイスを呼び出す関数を作成します。

def ocr_character(image_path):
    app_key = "<Your App Key>"
    request = RecognizeCharacterRequest.RecognizeCharacterRequest()
    request.set_accept_format('json')
    with open(image_path, 'rb') as file:
        image_data = file.read()
        base64_data = base64.b64encode(image_data)
        request.set_ImageURL(base64_data)
    response = create_aliyun_client().do_action_with_exception(request)
    result = json.loads(response)
    print(result)

上記のコードでは、アクセス キー、シークレット キー、アプリ キーを置き換えて、必要な画像のパスを渡す必要があります。特定する。

最後に、ocr_character 関数を呼び出し、認識する必要がある画像のパスを渡します。

if __name__ == "__main__":
    image_path = "<Your Image Path>"
    ocr_character(image_path)

ここでは画像のローカル パスが使用されていることに注意してください。ネットワーク上の画像を識別したい場合は、その URL を使用する必要があります。また、Alibaba Cloud の OCR インターフェイスは現在サポートされている画像形式が限られており、一般的には JPEG または PNG 形式の画像を使用することをお勧めします。

概要:

この記事では、Python を使用して Alibaba Cloud の OCR インターフェイスを呼び出し、テキスト抽出機能を実装する方法を紹介します。このインターフェースを介して、画像内のテキストを電子テキストに簡単に変換できるため、作業効率が向上し、手動での文字起こし作業の一部が簡素化されます。

この記事がお役に立てば幸いです!

以上がPython は Alibaba Cloud インターフェースを呼び出して OCR テキスト抽出機能を実装しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。