Rumah >pembangunan bahagian belakang >Tutorial Python >Pengaturcaraan Python melaksanakan perkongsian kod dok API pengecaman teks Baidu

Pengaturcaraan Python melaksanakan perkongsian kod dok API pengecaman teks Baidu

王林
王林asal
2023-08-25 13:57:071403semak imbas

Pengaturcaraan Python melaksanakan perkongsian kod dok API pengecaman teks Baidu

Pengaturcaraan Python untuk melaksanakan perkongsian kod dok API Pengecaman Teks Baidu

Pengenalan: API Pengecaman Teks Baidu ialah alat pengecaman teks yang berkuasa yang boleh mengekstrak teks daripada imej dan menukarnya menjadi teks boleh diedit. Dalam pengaturcaraan Python, kita boleh menggunakan kod dok API pengecaman teks Baidu untuk merealisasikan fungsi pengecaman teks. Artikel ini akan berkongsi program Python mudah untuk menunjukkan cara menggunakan API Pengecaman Teks Baidu untuk pengecaman teks.

1. Persediaan

  1. Daftar akaun Baidu Cloud

Sebelum menggunakan Baidu Text Recognition API, kami perlu mendaftar akaun Baidu Cloud dan mengaktifkan perkhidmatan API.

  1. Buat aplikasi pengecaman teks dan dapatkan Kunci API dan Kunci Rahsia

Buat aplikasi pengecaman teks dalam konsol Baidu Cloud dan dapatkan Kunci API dan Kunci Rahsia ini adalah kunci untuk membuat panggilan API.

  1. Pasang Python Baidu Cloud SDK

Jalankan arahan berikut dalam terminal untuk memasang Python Baidu Cloud SDK:

pip install baidu-aip

2. Tulis kod

Berikut ialah program Python mudah yang menunjukkan cara menggunakan Baidu Text Recognition API untuk pengecaman teks Pengecaman:

from aip import AipOcr

# 配置百度文字识别API的参数
APP_ID = '您的APP_ID'
API_KEY = '您的API_KEY'
SECRET_KEY = '您的SECRET_KEY'

# 创建一个AipOcr对象
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

# 读取图片文件
def get_file_content(file_path):
    with open(file_path, 'rb') as fp:
        return fp.read()

# 调用百度文字识别API进行文字识别
def recognize_text(image_path):
    # 读取图片文件
    image = get_file_content(image_path)

    # 调用百度文字识别API
    result = client.basicGeneral(image)

    # 解析识别结果
    if 'words_result' in result:
        for word_info in result['words_result']:
            print(word_info['words'])

# 测试代码
if __name__ == '__main__':
    image_path = 'test.png'  # 需要识别的图片文件路径
    recognize_text(image_path)

3. Analisis kod

  1. Konfigurasikan parameter API pengecaman teks Baidu

Pada permulaan kod, kami perlu mengisi APP_ID, API_KEY dan SECRET kami sendiri disimpan dalam Baidu Cloud Console. Gantikan "APP_ID anda", "API_KEY anda" dan "SECRET_KEY anda" dalam kod di atas dengan nilai yang sepadan.

  1. Buat objek AipOcr

Buat objek AipOcr dengan memasukkan APP_ID, API_KEY dan SECRET_KEY untuk panggilan API berikutnya.

  1. Baca fail imej

Tulis fungsi get_file_content untuk membaca kandungan binari fail imej. Apabila memanggil API pengecaman teks Baidu, fail imej perlu ditukar kepada format binari. get_file_content,用于读取图片文件的二进制内容。在调用百度文字识别API时,需要将图片文件转化为二进制格式。

  1. 调用百度文字识别API进行文字识别

编写一个函数recognize_text,用于调用百度文字识别API进行文字识别。在函数内部,我们先读取图片文件的二进制内容,然后调用client.basicGeneral方法,传入图片内容进行文字识别。

  1. 解析识别结果

输出识别结果,遍历识别结果中的每个词块,将其中的文字信息打印出来。

四、测试运行

将需要识别的图片文件放在代码中指定的路径,替换变量image_path

    Panggil API pengecaman teks Baidu untuk pengecaman teks

    Tulis fungsi recognize_text untuk memanggil API pengecaman teks Baidu untuk pengecaman teks. Di dalam fungsi, kami mula-mula membaca kandungan perduaan fail imej, dan kemudian memanggil kaedah client.basicGeneral untuk menghantar kandungan imej untuk pengecaman teks.

      🎜Analisis hasil pengecaman🎜🎜🎜Keluarkan hasil pengecaman, lalui setiap blok perkataan dalam hasil pengecaman dan cetak maklumat teks. 🎜🎜4. Test run🎜🎜Letakkan fail imej yang perlu dikenal pasti dalam laluan yang dinyatakan dalam kod dan gantikan nilai pembolehubah image_path. Kemudian jalankan kod dan anda boleh melihat maklumat teks dalam gambar pada konsol. 🎜🎜Ringkasan: 🎜🎜Artikel ini memperkenalkan cara menggunakan pengaturcaraan Python untuk merealisasikan pengecaman teks dalam gambar melalui API Pengecaman Teks Baidu. Dengan hanya menetapkan Kunci API dan Kunci Rahsia Baidu Cloud, hantar fail imej kepada API untuk pengecaman teks, dan kemudian huraikan hasil pengecaman untuk mendapatkan kandungan teks. Menggunakan SDK Python yang disediakan oleh Baidu Cloud, pembangun boleh melaksanakan fungsi pengecaman teks dengan cepat dengan hanya beberapa baris kod. 🎜

Atas ialah kandungan terperinci Pengaturcaraan Python melaksanakan perkongsian kod dok API pengecaman teks Baidu. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel berkaitan

Lihat lagi