Maison  >  Article  >  développement back-end  >  La programmation Python implémente le partage de code d'accueil de l'API de reconnaissance de texte Baidu

La programmation Python implémente le partage de code d'accueil de l'API de reconnaissance de texte Baidu

王林
王林original
2023-08-25 13:57:071367parcourir

La programmation Python implémente le partage de code daccueil de lAPI de reconnaissance de texte Baidu

Programmation Python pour implémenter le partage de code d'accueil de l'API Baidu Text Recognition

Introduction : L'API Baidu Text Recognition est un puissant outil de reconnaissance de texte qui peut extraire le texte des images et le convertir en texte modifiable. Dans la programmation Python, nous pouvons utiliser le code d'accueil de l'API de reconnaissance de texte Baidu pour réaliser la fonction de reconnaissance de texte. Cet article partagera un programme Python simple pour montrer comment utiliser l'API Baidu Text Recognition pour la reconnaissance de texte.

1. Préparation

  1. Enregistrer un compte Baidu Cloud

Avant d'utiliser l'API de reconnaissance de texte Baidu, nous devons enregistrer un compte Baidu Cloud et activer le service API.

  1. Créez une application de reconnaissance de texte et obtenez la clé API et la clé secrète

Créez une application de reconnaissance de texte dans la console Baidu Cloud et obtenez la clé API et la clé secrète. Ces deux paramètres sont la clé pour effectuer des appels API.

  1. Installez le SDK Python Baidu Cloud

Exécutez la commande suivante dans le terminal pour installer le SDK Python Baidu Cloud :

pip install baidu-aip

2. Écrivez le code

Ce qui suit est un programme Python simple qui montre comment utiliser la reconnaissance de texte Baidu API pour la reconnaissance de texte Reconnaissance :

from aip import AipOcr

# 配置百度文字识别API的参数
APP_ID = '您的APP_ID'
API_KEY = '您的API_KEY'
SECRET_KEY = '您的SECRET_KEY'

# 创建一个AipOcr对象
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

# 读取图片文件
def get_file_content(file_path):
    with open(file_path, 'rb') as fp:
        return fp.read()

# 调用百度文字识别API进行文字识别
def recognize_text(image_path):
    # 读取图片文件
    image = get_file_content(image_path)

    # 调用百度文字识别API
    result = client.basicGeneral(image)

    # 解析识别结果
    if 'words_result' in result:
        for word_info in result['words_result']:
            print(word_info['words'])

# 测试代码
if __name__ == '__main__':
    image_path = 'test.png'  # 需要识别的图片文件路径
    recognize_text(image_path)

3. Analyse du code

  1. Configurez les paramètres de l'API de reconnaissance de texte Baidu

Au début du code, nous devons remplir nos propres APP_ID, API_KEY et SECRET_KEY. Ces paramètres sont. stockés dans la console Baidu Cloud. Remplacez « votre APP_ID », « votre API_KEY » et « votre SECRET_KEY » dans le code ci-dessus par les valeurs correspondantes.

  1. Créez un objet AipOcr

Créez un objet AipOcr en passant APP_ID, API_KEY et SECRET_KEY pour les appels d'API ultérieurs.

  1. Lire les fichiers image

Écrivez une fonction get_file_content pour lire le contenu binaire des fichiers image. Lors de l'appel de l'API de reconnaissance de texte Baidu, le fichier image doit être converti au format binaire. get_file_content,用于读取图片文件的二进制内容。在调用百度文字识别API时,需要将图片文件转化为二进制格式。

  1. 调用百度文字识别API进行文字识别

编写一个函数recognize_text,用于调用百度文字识别API进行文字识别。在函数内部,我们先读取图片文件的二进制内容,然后调用client.basicGeneral方法,传入图片内容进行文字识别。

  1. 解析识别结果

输出识别结果,遍历识别结果中的每个词块,将其中的文字信息打印出来。

四、测试运行

将需要识别的图片文件放在代码中指定的路径,替换变量image_path

    Appelez l'API de reconnaissance de texte Baidu pour la reconnaissance de texte

    Écrivez une fonction recognize_text pour appeler l'API de reconnaissance de texte Baidu pour la reconnaissance de texte. À l'intérieur de la fonction, nous lisons d'abord le contenu binaire du fichier image, puis appelons la méthode client.basicGeneral pour transmettre le contenu de l'image pour la reconnaissance de texte.

      🎜Analysez les résultats de la reconnaissance🎜🎜🎜Sortez les résultats de la reconnaissance, parcourez chaque bloc de mots dans les résultats de la reconnaissance et imprimez les informations textuelles. 🎜🎜4. Test d'exécution🎜🎜Placez le fichier image à identifier dans le chemin spécifié dans le code et remplacez la valeur de la variable image_path. Ensuite, exécutez le code et vous pourrez voir les informations textuelles dans l'image sur la console. 🎜🎜Résumé : 🎜🎜Cet article explique comment utiliser la programmation Python pour reconnaître le texte dans les images via l'API Baidu Text Recognition. En définissant simplement la clé API et la clé secrète de Baidu Cloud, transmettez le fichier image à l'API pour la reconnaissance de texte, puis analysez les résultats de la reconnaissance pour obtenir le contenu du texte. Grâce au SDK Python fourni par Baidu Cloud, les développeurs peuvent rapidement implémenter des fonctions de reconnaissance de texte avec seulement quelques lignes de code. 🎜

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn