この記事では主に Baidu AI に基づく Python テキスト認識の例を紹介し、参考として提供します。見てみましょう
Baidu AI のテキスト認識ライブラリを使用して、呼び出しの例が作成されます。ここで、filePath は画像のパスであり、認識のためにテキストを含む画像を渡すことができます。
baidu-aip ライブラリをダウンロードするには、pip を使用して直接ダウンロードすることもできます: pip install baidu-aip または、PyCharm などの開発ツールでダウンロードできます。
次に、次のコードを実行します。
# -*- coding: UTF-8 -*- from aip import AipOcr import json # 定义常量 APP_ID = '9851066' API_KEY = 'LUGBatgyRGoerR9FZbV4SQYk' SECRET_KEY = 'fB2MNz1c2UHLTximFlC4laXPg7CVfyjV' # 初始化AipFace对象 aipOcr = AipOcr(APP_ID, API_KEY, SECRET_KEY) # 读取图片 filePath = "WechatIMG1.jpeg" def get_file_content(filePath): with open(filePath, 'rb') as fp: return fp.read() # 定义参数变量 options = { 'detect_direction': 'true', 'language_type': 'CHN_ENG', } # 调用通用文字识别接口 result = aipOcr.basicGeneral(get_file_content(filePath), options) print(json.dumps(result).decode("unicode-escape"))
出力結果:
{"log_id": 1424393327, "direction": 0, "words_result_num": 2, "words_result": [{"words": "ただではないですかお金について? !"}, {"words": "SKILLS"}]}
今回は認識に誤りがいくつかあり、それは不鮮明な写真に関するものでした。以下は私が認識した画像です。
ユニバーサルテキスト認識の戻りデータパラメータの詳細
フィールド | 必須 | タイプ | 説明 |
---|---|---|---|
方向 | No | 番号 | 画像の方向が存在する場合検出方向=true。 - -1: 未定義、 - 0: 陽性、 - 1: 反時計回りに 90 度、 - 2: 反時計回りに 180 度、 - 3: 反時計回りに 270 度 |
log_id | は、問題の場所に使用される | number | の固有のログ ID です |
words_result_num | は、 | number | 同定結果の要素of _result Number |
words_result | は、 | array | の位置決めと認識結果の配列 |
+words | no | string | 認識結果string |
関連するおすすめ:
Pythonは再帰アルゴリズムに基づいてハノイの塔とフィボナッチ数列を実装します
PythonはTCPに基づいてチャットロボット機能を実装します
以上がBaidu AI に基づく Python テキスト認識の例の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。