Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Cara menggunakan alat EasyOCR untuk mengenali teks imej dalam Python

Cara menggunakan alat EasyOCR untuk mengenali teks imej dalam Python

WBOY
WBOYke hadapan
2023-04-30 09:40:062351semak imbas

Apakah itu EasyOCR?

Penerangan: EasyOCR ialah modul ular sawa untuk mengekstrak teks daripada imej Ia adalah OCR tujuan umum yang boleh membaca teks dan dokumen padat semula jadi. Pada masa ini menyokong lebih 80 bahasa dan semua skrip penulisan popular termasuk: Latin, Cina, Arab, Sanskrit, Cyrillic dan banyak lagi.

EasyOCR ialah alat pengecaman aksara optik (OCR) yang dilaksanakan dalam PyTorch.

S: Apakah yang boleh anda lakukan dengan EasyOCR?

Penerangan: EasyOCR menyokong dua cara berjalan, satu ialah CPU yang biasa digunakan, dan satu lagi memerlukan sokongan GPU dan persekitaran CUDA perlu dipasang. Kami menggunakan Ia boleh melakukan pengecaman bahasa dan teks dalam gambar, seperti pengecaman gambar dalam program mini dan pengecaman plat kenderaan (iaitu, sistem pengurusan hutang kereta).

Pasang EasyOCR

Dalam tetingkap arahan, gunakan pip untuk memasang versi stabil EasyOCR.

pip install easyocr

Apabila menggunakan EasyOCR

import easyocr

reader = easyocr.Reader(
    ['ch_sim', 'en'],
    gpu=False,
    model_storage_directory='model/.',
    user_network_directory='model/.',
)
result = reader.readtext('examples/chinese.jpg')

untuk melaksanakan kod di atas, model pengesanan dan pengecaman akan dimuat turun secara automatik ke direktori yang ditentukan melalui rangkaian.

  • ['ch_sim', 'en'],: Tentukan bahasa yang diiktiraf

  • gpu=False,: Tetapkan sama ada hendak menggunakan GPU ( EasyOCR Ia berjalan dengan lebih cekap pada GPU Set False apabila tiada GPU atau memori GPU tidak mencukupi)

  • model_storage_directory='model/.',: Kesan dan kenal pasti laluan storan model. (apabila tidak ditetapkan) Disimpan dalam direktori ~/.EasyOCR/model secara lalai)

Hasil pengecaman result ialah senarai dan setiap item dalam senarai ialah hasil pengecaman dengan panjang 3. Contohnya ([[189, 75], [469, 75], [469, 165], [189, 165]], '愚园路', 0.3754989504814148), nilai tersebut adalah kotak sempadan, teks yang dikesan dan keyakinan nilai masing-masing.

easyocr-server

EasyOCR server ialah pelayan untuk mengekstrak teks daripada imej. Ia ialah OCR tujuan umum yang boleh membaca teks pemandangan semula jadi dan teks padat dalam dokumen. Pada masa ini menyokong 80+ bahasa dan berkembang.

Langkah Pemasangan

Langkah 0. Muat turun pelayan easyocr daripada GitHub dan pasangkannya.

git clone https://github.com/hekaiyou/easyocr-server.git

Langkah 1. Pasang modul easyocr, botol dan gevent menggunakan PyPI.

cd easyocr-server
pip install -r requirements.txt

Sahkan pemasangan

python main.py
  • Pelayar: http://localhost:8080/ocr/

  • CMD: curl http://localhost:8080/ocr/ -F "language=en" -F "img_file=@examples/english.png"

Selepas pengesahan berjaya, anda sepatutnya dapat melihat hasil inferens yang dicetak dalam penyemak imbas.

Cara menggunakan alat EasyOCR untuk mengenali teks imej dalam Python

Perkhidmatan penggunaan melalui Docker

Kami menyediakan Fail Docker untuk membina imej.

docker build -t easyocr-server:latest .

Jalankannya.

docker run -it -v {DATA_DIR}:/workspace/model -p 8083:8080 easyocr-server:latest
Language Code Name
Abaza abq
Adyghe ady
Afrikaans af
Angika ang
Arabic ar
Assamese as
Avar ava
Azerbaijani az
Belarusian be
Bulgarian bg
Bihari bh
Bhojpuri bho
Bengali bn
Bosnian bs
Simplified Chinese ch_sim
Traditional Chinese ch_tra
Chechen che
Czech cs
Welsh cy
Danish da
Dargwa dar
German de
English en
Spanish es
Estonian et
Persian (Farsi) fa
French fr
Irish ga
Goan Konkani gom
Hindi hi
Croatian hr
Hungarian hu
Indonesian id
Ingush inh
Icelandic is
Italian it
Japanese ja
Kabardian kbd
Kannada kn
Korean ko
Kurdish ku
Latin la
Lak lbe
Lezghian lez
Lithuanian lt
Latvian lv
Magahi mah
Maithili mai
Maori mi
Mongolian mn
Marathi mr
Malay ms
Maltese mt
Nepali ne
Newari new
Dutch nl
Norwegian no
Occitan oc
Pali pi
Polish pl
Portuguese pt
Romanian ro
Russian ru
Serbian (cyrillic) rs_cyrillic
Serbian (latin) rs_latin
Nagpuri sck
Slovak sk
Slovenian sl
Albanian sq
Swedish sv
Swahili sw
Tamil ta
Tabassaran tab
Telugu te
Thai th
Tajik tjk
Tagalog tl
Turkish tr
Uyghur ug
Ukranian uk
Urdu ur
Uzbek uz
Vietnamese vi

Atas ialah kandungan terperinci Cara menggunakan alat EasyOCR untuk mengenali teks imej dalam Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:yisu.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam