チュートリアル: Python が Huawei Cloud インターフェースに接続して OCR テキスト認識を実装する
まず、このチュートリアルでは、Python プログラミング言語を使用して Huawei Cloud インターフェースに接続し、OCR (光学式) を使用する方法を学びます。文字認識、光学式文字認識)技術により、テキスト認識機能を実現します。 OCR テクノロジーは、画像内のテキストを編集および検索可能な電子テキストに変換でき、さまざまなテキスト認識シナリオに非常に適しています。
Huawei Cloud インターフェイスに接続する前に、次のことを行う必要があります。 Python リクエスト ライブラリを使用して HTTP リクエストを送信します。リクエスト ライブラリをインストールしていない場合は、次のコマンドを使用してインストールできます。
$ pip install requests
import requests # 华为云OCR服务端点 ENDPOINT = 'https://ocr.cn-north-4.myhuaweicloud.com' # 替换成你的API密钥 API_KEY = 'your_api_key' API_SECRET = 'your_api_secret'
def recognize_text(image_path): url = f'{ENDPOINT}/v1.0/ocr/general-text' headers = { 'Content-Type': 'application/json', 'X-Auth-Token': 'Token ' + get_auth_token() } data = { "url": image_path } response = requests.post(url, headers=headers, json=data) result = response.json() if 'result' in result: text = "" for item in result['result']['words_block_list']: text += item['words'] + ' ' return text else: return None def get_auth_token(): url = 'https://iam.cn-north-4.myhuaweicloud.com/v3/auth/tokens' headers = { 'Content-Type': 'application/json' } data = { "auth": { "identity": { "methods": [ "password" ], "password": { "user": { "name": API_KEY, "password": API_SECRET, "domain": { "name": "hwid" } } } }, "scope": { "project": { "name": "cn-north-4" } } } } response = requests.post(url, headers=headers, json=data) if 'X-Subject-Token' in response.headers: return response.headers['X-Subject-Token'] else: return None # 使用示例 image_path = '/path/to/your/image.jpg' result = recognize_text(image_path) if result: print('文字识别结果:', result) else: print('识别失败')上記のコード例では、画像ファイルのパスをパラメータとして受け取り、認識されたテキストの結果を返す
recognize_text 関数を定義しました。 HTTP POSTリクエストをHuawei CloudのOCRインターフェースに送信し、画像のURLをJSONデータの形式でAPIに送信します。
以上がチュートリアル: Python が Huawei Cloud インターフェイスに接続して OCR テキスト認識を実装するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。