ホームページ  >  記事  >  バックエンド開発  >  チュートリアル: Python が Huawei Cloud インターフェイスに接続して OCR テキスト認識を実装する

チュートリアル: Python が Huawei Cloud インターフェイスに接続して OCR テキスト認識を実装する

WBOY
WBOYオリジナル
2023-07-05 13:28:371011ブラウズ

チュートリアル: Python が Huawei Cloud インターフェースに接続して OCR テキスト認識を実装する

まず、このチュートリアルでは、Python プログラミング言語を使用して Huawei Cloud インターフェースに接続し、OCR (光学式) を使用する方法を学びます。文字認識、光学式文字認識)技術により、テキスト認識機能を実現します。 OCR テクノロジーは、画像内のテキストを編集および検索可能な電子テキストに変換でき、さまざまなテキスト認識シナリオに非常に適しています。

  1. 準備
    開始する前に、次の準備を完了する必要があります。
  2. Huawei Cloud アカウント (https://www.huaweicloud.com/) に登録してログインします。 )
  3. OCR サービス インスタンスを作成し、対応する API キーとサービス エンドポイント (エンドポイント) を取得します。
  4. #依存ライブラリをインストールします。

    Huawei Cloud インターフェイスに接続する前に、次のことを行う必要があります。 Python リクエスト ライブラリを使用して HTTP リクエストを送信します。リクエスト ライブラリをインストールしていない場合は、次のコマンドを使用してインストールできます。

    $ pip install requests

  5. Python コードの作成
まず、リクエスト ライブラリをインポートする必要があります。いくつかの定数変数を定義します。

import requests

# 华为云OCR服务端点
ENDPOINT = 'https://ocr.cn-north-4.myhuaweicloud.com'

# 替换成你的API密钥
API_KEY = 'your_api_key'
API_SECRET = 'your_api_secret'

    OCR テキスト認識関数の実装
次に、OCR テキスト認識関数を実装します。認識する画像をサーバーにアップロードし、Huawei Cloud APIにリクエストを送信してテキスト認識結果を取得できます。

def recognize_text(image_path):
    url = f'{ENDPOINT}/v1.0/ocr/general-text'
    headers = {
        'Content-Type': 'application/json',
        'X-Auth-Token': 'Token ' + get_auth_token()
    }
    data = {
        "url": image_path
    }
    response = requests.post(url, headers=headers, json=data)
    result = response.json()

    if 'result' in result:
        text = ""
        for item in result['result']['words_block_list']:
            text += item['words'] + ' '
        return text
    else:
        return None


def get_auth_token():
    url = 'https://iam.cn-north-4.myhuaweicloud.com/v3/auth/tokens'
    headers = {
        'Content-Type': 'application/json'
    }
    data = {
        "auth": {
            "identity": {
                "methods": [
                    "password"
                ],
                "password": {
                    "user": {
                        "name": API_KEY,
                        "password": API_SECRET,
                        "domain": {
                            "name": "hwid"
                        }
                    }
                }
            },
            "scope": {
                "project": {
                    "name": "cn-north-4"
                }
            }
        }
    }
    response = requests.post(url, headers=headers, json=data)

    if 'X-Subject-Token' in response.headers:
        return response.headers['X-Subject-Token']
    else:
        return None


# 使用示例
image_path = '/path/to/your/image.jpg'
result = recognize_text(image_path)
if result:
    print('文字识别结果:', result)
else:
    print('识别失败')

上記のコード例では、画像ファイルのパスをパラメータとして受け取り、認識されたテキストの結果を返す

recognize_text 関数を定義しました。 HTTP POSTリクエストをHuawei CloudのOCRインターフェースに送信し、画像のURLをJSONデータの形式でAPIに送信します。

API から返される結果は JSON 形式のデータであり、JSON データを解析することでテキスト認識結果を抽出します。

注: コード例では、準備作業で取得した API キーとサービス エンドポイントを使用しています。必ず独自の API キーに置き換えてください。

    概要
  1. このチュートリアルを通じて、Python を使用して Huawei Cloud の OCR インターフェイスに接続し、テキスト認識機能を実装する方法を学びました。 OCR テクノロジーは、文書のスキャン、ナンバー プレート認識、画像翻訳など、さまざまなシナリオで広く使用されています。実際のニーズに基づいて、より複雑な認識ニーズを満たすようにコードをさらに調整できます。

以上がチュートリアル: Python が Huawei Cloud インターフェイスに接続して OCR テキスト認識を実装するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。