Rumah >pembangunan bahagian belakang >Tutorial Python >Cara menggunakan alat EasyOCR untuk mengenali teks imej dalam Python
Penerangan: EasyOCR ialah modul ular sawa untuk mengekstrak teks daripada imej Ia adalah OCR tujuan umum yang boleh membaca teks dan dokumen padat semula jadi. Pada masa ini menyokong lebih 80 bahasa dan semua skrip penulisan popular termasuk: Latin, Cina, Arab, Sanskrit, Cyrillic dan banyak lagi.
EasyOCR ialah alat pengecaman aksara optik (OCR) yang dilaksanakan dalam PyTorch.
Penerangan: EasyOCR menyokong dua cara berjalan, satu ialah CPU yang biasa digunakan, dan satu lagi memerlukan sokongan GPU dan persekitaran CUDA perlu dipasang. Kami menggunakan Ia boleh melakukan pengecaman bahasa dan teks dalam gambar, seperti pengecaman gambar dalam program mini dan pengecaman plat kenderaan (iaitu, sistem pengurusan hutang kereta).
Dalam tetingkap arahan, gunakan pip untuk memasang versi stabil EasyOCR.
pip install easyocr
import easyocr reader = easyocr.Reader( ['ch_sim', 'en'], gpu=False, model_storage_directory='model/.', user_network_directory='model/.', ) result = reader.readtext('examples/chinese.jpg')
untuk melaksanakan kod di atas, model pengesanan dan pengecaman akan dimuat turun secara automatik ke direktori yang ditentukan melalui rangkaian.
['ch_sim', 'en'],: Tentukan bahasa yang diiktiraf
gpu=False,: Tetapkan sama ada hendak menggunakan GPU ( EasyOCR Ia berjalan dengan lebih cekap pada GPU Set False apabila tiada GPU atau memori GPU tidak mencukupi)
model_storage_directory='model/.',: Kesan dan kenal pasti laluan storan model. (apabila tidak ditetapkan) Disimpan dalam direktori ~/.EasyOCR/model secara lalai)
Hasil pengecaman result
ialah senarai dan setiap item dalam senarai ialah hasil pengecaman dengan panjang 3
. Contohnya ([[189, 75], [469, 75], [469, 165], [189, 165]], '愚园路', 0.3754989504814148)
, nilai tersebut adalah kotak sempadan, teks yang dikesan dan keyakinan nilai masing-masing.
EasyOCR server ialah pelayan untuk mengekstrak teks daripada imej. Ia ialah OCR tujuan umum yang boleh membaca teks pemandangan semula jadi dan teks padat dalam dokumen. Pada masa ini menyokong 80+ bahasa dan berkembang.
Langkah 0. Muat turun pelayan easyocr daripada GitHub dan pasangkannya.
git clone https://github.com/hekaiyou/easyocr-server.git
Langkah 1. Pasang modul easyocr, botol dan gevent menggunakan PyPI.
cd easyocr-server pip install -r requirements.txt
python main.py
Pelayar: http://localhost:8080/ocr/
CMD: curl http://localhost:8080/ocr/ -F "language=en" -F "img_file=@examples/english.png"
Selepas pengesahan berjaya, anda sepatutnya dapat melihat hasil inferens yang dicetak dalam penyemak imbas.
Kami menyediakan Fail Docker untuk membina imej.
docker build -t easyocr-server:latest .
Jalankannya.
docker run -it -v {DATA_DIR}:/workspace/model -p 8083:8080 easyocr-server:latest
Language | Code Name |
---|---|
Abaza | abq |
Adyghe | ady |
Afrikaans | af |
Angika | ang |
Arabic | ar |
Assamese | as |
Avar | ava |
Azerbaijani | az |
Belarusian | be |
Bulgarian | bg |
Bihari | bh |
Bhojpuri | bho |
Bengali | bn |
Bosnian | bs |
Simplified Chinese | ch_sim |
Traditional Chinese | ch_tra |
Chechen | che |
Czech | cs |
Welsh | cy |
Danish | da |
Dargwa | dar |
German | de |
English | en |
Spanish | es |
Estonian | et |
Persian (Farsi) | fa |
French | fr |
Irish | ga |
Goan Konkani | gom |
Hindi | hi |
Croatian | hr |
Hungarian | hu |
Indonesian | id |
Ingush | inh |
Icelandic | is |
Italian | it |
Japanese | ja |
Kabardian | kbd |
Kannada | kn |
Korean | ko |
Kurdish | ku |
Latin | la |
Lak | lbe |
Lezghian | lez |
Lithuanian | lt |
Latvian | lv |
Magahi | mah |
Maithili | mai |
Maori | mi |
Mongolian | mn |
Marathi | mr |
Malay | ms |
Maltese | mt |
Nepali | ne |
Newari | new |
Dutch | nl |
Norwegian | no |
Occitan | oc |
Pali | pi |
Polish | pl |
Portuguese | pt |
Romanian | ro |
Russian | ru |
Serbian (cyrillic) | rs_cyrillic |
Serbian (latin) | rs_latin |
Nagpuri | sck |
Slovak | sk |
Slovenian | sl |
Albanian | sq |
Swedish | sv |
Swahili | sw |
Tamil | ta |
Tabassaran | tab |
Telugu | te |
Thai | th |
Tajik | tjk |
Tagalog | tl |
Turkish | tr |
Uyghur | ug |
Ukranian | uk |
Urdu | ur |
Uzbek | uz |
Vietnamese | vi |
Atas ialah kandungan terperinci Cara menggunakan alat EasyOCR untuk mengenali teks imej dalam Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!