Rumah >pembangunan bahagian belakang >Tutorial Python >Python memanggil antara muka Alibaba Cloud untuk melaksanakan fungsi pengekstrakan teks OCR
Python memanggil antara muka Alibaba Cloud untuk melaksanakan fungsi pengekstrakan teks OCR
Alibaba Cloud menyediakan satu siri API yang berkuasa, termasuk antara muka pengecaman teks OCR (Optical Character Recognition). Melalui antara muka ini, kita boleh mengenal pasti teks dalam gambar, yang sangat sesuai untuk beberapa senario pengekstrakan teks, seperti menukar teks dalam dokumen kertas kepada teks elektronik.
Artikel ini akan memperkenalkan cara memanggil antara muka OCR Alibaba Cloud dalam Python dan melaksanakan fungsi pengekstrakan teks. Berikut ialah langkah khusus:
Langkah 1: Pasang Alibaba Cloud SDK
Untuk memanggil antara muka API Alibaba Cloud, anda perlu memasang SDK yang sepadan terlebih dahulu. Dalam Python, kita boleh memasang Alibaba Cloud SDK melalui arahan pip.
Buka terminal dan masukkan arahan berikut:
pip install aliyun-python-sdk-core pip install aliyun-python-sdk-ocr
Langkah 2: Dapatkan Kunci Akses dan Kunci Rahsia
Untuk menghubungi API Alibaba Cloud, anda perlu menyediakan Kunci Akses dan Kunci Rahsia. Anda boleh memohon dan mendapatkan dua maklumat penting ini pada konsol Alibaba Cloud. Pastikan anda menyimpan kedua-dua maklumat ini di tempat yang selamat.
Langkah 3: Tulis kod untuk memanggil antara muka OCR
Mula-mula anda perlu mengimport perpustakaan yang berkaitan:
import base64 import json import urllib import urllib.request from aliyunsdkcore import client from aliyunsdkocr.request.v20191230 import RecognizeCharacterRequest
Seterusnya, mulakan klien Alibaba Cloud:
def create_aliyun_client(): access_key = "<Your Access Key>" secret_key = "<Your Secret Key>" region_id = "cn-hangzhou" return client.AcsClient(access_key, secret_key, region_id)
Kemudian, tulis fungsi untuk memanggil antara muka OCR:
def ocr_character(image_path): app_key = "<Your App Key>" request = RecognizeCharacterRequest.RecognizeCharacterRequest() request.set_accept_format('json') with open(image_path, 'rb') as file: image_data = file.read() base64_data = base64.b64encode(image_data) request.set_ImageURL(base64_data) response = create_aliyun_client().do_action_with_exception(request) result = json.loads(response) print(result)
Pada kod di atas, anda perlu menggantikan Kunci Akses, Kunci Rahsia dan Kunci Apl, dan masukkan laluan imej yang ingin anda kenal pasti.
Akhir sekali, panggil fungsi ocr_character
dan lulus dalam laluan imej yang perlu dikenal pasti.
if __name__ == "__main__": image_path = "<Your Image Path>" ocr_character(image_path)
Perhatikan bahawa laluan setempat imej digunakan di sini Jika anda ingin mengenal pasti imej di Internet, anda perlu menggunakan URLnya. Selain itu, antara muka OCR Alibaba Cloud pada masa ini menyokong format imej terhad Secara umumnya, adalah disyorkan untuk menggunakan imej dalam format JPEG atau PNG.
Ringkasan:
Artikel ini memperkenalkan cara menggunakan Python untuk memanggil antara muka OCR Alibaba Cloud untuk melaksanakan fungsi pengekstrakan teks. Melalui antara muka ini, kami boleh menukar teks dalam gambar dengan mudah kepada teks elektronik, yang meningkatkan kecekapan kerja dan memudahkan beberapa kerja transkripsi manual.
Semoga artikel ini bermanfaat untuk anda!
Atas ialah kandungan terperinci Python memanggil antara muka Alibaba Cloud untuk melaksanakan fungsi pengekstrakan teks OCR. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!