Rumah >pembangunan bahagian belakang >Tutorial Python >Python代码实现图片文字的识别

Python代码实现图片文字的识别

零到壹度asal: 2018-04-02 14:12:092871semak imbas

本篇文章给大家分享的是Python代码实现图片文字识别，内容挺不错的，希望可以帮助到有需要的朋友

我们以识别诗词为例
下面是我们要识别的图片

先看下效果图

图片文字识别.gif
我们运行代码后识别的结果,有几个字没有正确识别，但是大多数字都能识别出来。

风急天高猿啸哀 渚芸胄芳少白鸟飞凤
无边落木萧萧下, 不尽长量工盲衮宕衮来
万里悲秋常1乍窨, 百年多病独登氤
艰难苦恨擎霜量 漂倒新停澍酉帆

一行代码就能识别图片，我们背后要做些准备工作的

这里我们需要用到两个库：pytesseract和PIL
同时我们还需要安装识别引擎tesseract-ocr

下面就来讲讲这几个库的安装，因为只有这几个库安装好以后Python才能实现一行代码实现图片文字识别

一，pytesseract和PIL的安装

安装这两个包可以借助pip
- 1，命令行安装
pip install PIL
pip install pytesseract
- 2，如果你用的pycharm编辑器，就可以直接借助pycharm实现快速安装。
在pycharm的Settings设置页按照下面步骤操作
pycharm用pip安装库.png
这样就能成功安装pytesseract，安装PIL只需要在上面第三步里搜索PIL并点击安装即可
安装成功.png

这时我们安转好了库，运行下面代码

from PIL import Image
import pytesseract
text=pytesseract.image_to_string(Image.open(&#39;denggao.jpeg&#39;),lang=&#39;chi_sim&#39;)
print(text)

会报下面错误，错误原因是：没有安装识别引擎tesseract-ocr

二，安装识别引擎tesseract-ocr

1.下载下面的安装包，然后直接点击安装即可
tesseract-ocr安装包和中文语言包

解压安装tesseract-ocr后做如下操作，就可以支持中文识别了。因为tesseract-ocr默认不支持中文识别。
支持中文识别.png

2，安装完成tesseract-ocr后，我们还需要做一下配置
在C:\Users\huxiu\AppData\Local\Programs\Python\Python35\Lib\site-packages\pytesseract找到pytesseract.py打开后做如下操作

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
#tesseract_cmd = &#39;tesseract&#39;
tesseract_cmd = &#39;C:/Program Files (x86)/Tesseract-OCR/tesseract.exe&#39;

也可以通过pycharm快速打开pytesseract.py

打开pytesseract包.png

关联OCR和pytesseract.png

至此我们所有的配置就完成了，运行下面代码就可以把杜甫的登高这首图片诗解析成文字了

项目源码.png

Atas ialah kandungan terperinci Python代码实现图片文字的识别. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Python pip pycharm ocr

Kenyataan：

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel sebelumnya：深度解析Python之字典表达式Artikel seterusnya：关于Python中的range 对象是不是迭代器的探讨

Artikel berkaitan

Lihat lagi