Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Python memanggil antara muka Alibaba Cloud untuk melaksanakan fungsi pengekstrakan teks OCR

Python memanggil antara muka Alibaba Cloud untuk melaksanakan fungsi pengekstrakan teks OCR

王林
王林asal
2023-07-05 21:49:351976semak imbas

Python memanggil antara muka Alibaba Cloud untuk melaksanakan fungsi pengekstrakan teks OCR

Alibaba Cloud menyediakan satu siri API yang berkuasa, termasuk antara muka pengecaman teks OCR (Optical Character Recognition). Melalui antara muka ini, kita boleh mengenal pasti teks dalam gambar, yang sangat sesuai untuk beberapa senario pengekstrakan teks, seperti menukar teks dalam dokumen kertas kepada teks elektronik.

Artikel ini akan memperkenalkan cara memanggil antara muka OCR Alibaba Cloud dalam Python dan melaksanakan fungsi pengekstrakan teks. Berikut ialah langkah khusus:

Langkah 1: Pasang Alibaba Cloud SDK

Untuk memanggil antara muka API Alibaba Cloud, anda perlu memasang SDK yang sepadan terlebih dahulu. Dalam Python, kita boleh memasang Alibaba Cloud SDK melalui arahan pip.

Buka terminal dan masukkan arahan berikut:

pip install aliyun-python-sdk-core
pip install aliyun-python-sdk-ocr

Langkah 2: Dapatkan Kunci Akses dan Kunci Rahsia

Untuk menghubungi API Alibaba Cloud, anda perlu menyediakan Kunci Akses dan Kunci Rahsia. Anda boleh memohon dan mendapatkan dua maklumat penting ini pada konsol Alibaba Cloud. Pastikan anda menyimpan kedua-dua maklumat ini di tempat yang selamat.

Langkah 3: Tulis kod untuk memanggil antara muka OCR

Mula-mula anda perlu mengimport perpustakaan yang berkaitan:

import base64
import json
import urllib
import urllib.request
from aliyunsdkcore import client
from aliyunsdkocr.request.v20191230 import RecognizeCharacterRequest

Seterusnya, mulakan klien Alibaba Cloud:

def create_aliyun_client():
    access_key = "<Your Access Key>"
    secret_key = "<Your Secret Key>"
    region_id = "cn-hangzhou"
    return client.AcsClient(access_key, secret_key, region_id)

Kemudian, tulis fungsi untuk memanggil antara muka OCR:

def ocr_character(image_path):
    app_key = "<Your App Key>"
    request = RecognizeCharacterRequest.RecognizeCharacterRequest()
    request.set_accept_format('json')
    with open(image_path, 'rb') as file:
        image_data = file.read()
        base64_data = base64.b64encode(image_data)
        request.set_ImageURL(base64_data)
    response = create_aliyun_client().do_action_with_exception(request)
    result = json.loads(response)
    print(result)

Pada kod di atas, anda perlu menggantikan Kunci Akses, Kunci Rahsia dan Kunci Apl, dan masukkan laluan imej yang ingin anda kenal pasti.

Akhir sekali, panggil fungsi ocr_character dan lulus dalam laluan imej yang perlu dikenal pasti.

if __name__ == "__main__":
    image_path = "<Your Image Path>"
    ocr_character(image_path)

Perhatikan bahawa laluan setempat imej digunakan di sini Jika anda ingin mengenal pasti imej di Internet, anda perlu menggunakan URLnya. Selain itu, antara muka OCR Alibaba Cloud pada masa ini menyokong format imej terhad Secara umumnya, adalah disyorkan untuk menggunakan imej dalam format JPEG atau PNG.

Ringkasan:

Artikel ini memperkenalkan cara menggunakan Python untuk memanggil antara muka OCR Alibaba Cloud untuk melaksanakan fungsi pengekstrakan teks. Melalui antara muka ini, kami boleh menukar teks dalam gambar dengan mudah kepada teks elektronik, yang meningkatkan kecekapan kerja dan memudahkan beberapa kerja transkripsi manual.

Semoga artikel ini bermanfaat untuk anda!

Atas ialah kandungan terperinci Python memanggil antara muka Alibaba Cloud untuk melaksanakan fungsi pengekstrakan teks OCR. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn