1. Tesseract 소개
Tesseract는 OCR 라이브러리입니다(OCR은 Optical Character Recognition(광학 문자 인식)의 약어입니다.) 텍스트 데이터를 스캔한 다음 이미지 파일을 분석 및 처리하고 텍스트 및 레이아웃 정보를 얻는 데 사용됩니다. Tesseract는 현재 비교적 정확한 인식으로 최고의 OCR 라이브러리로 인정받고 있습니다.
2. Tesseract 사용
1. Tesseract 다운로드 및 설치: 다운로드하려면 클릭하세요.
2. Windows 시스템에서 환경 변수를 설정하세요.
#根据下载安装文件的路径配置环境变量 set TESSDATA_PREFIX F:\Tesseract-OCR\
3. 4. Python 스크립트에서 tesseract.exe 애플리케이션을 소개하는 방법:
pip install pytesseract
5. 사례 데모
다음 그림 텍스트를 인식하세요.
pytesseract.pytesseract.tesseract_cmd = r'F:\Tesseract-OCR\tesseract.exe'결과 데모:
423a585462adc67b2772248ce5bb3c76
Google
import pytesseract
from PIL import Image
#1.引入Tesseract程序
pytesseract.pytesseract.tesseract_cmd = r'F:\Tesseract-OCR\tesseract.exe'
#2.使用Image模块下的Open()函数打开图片
image = Image.open('6.jpg',mode='r')
print(image)
#3.识别图片文字
code= pytesseract.image_to_string(image)
print(code)
관련 권장 사항:
Python에서 pytesseract를 호출하여 웹사이트 인증 코드
위 내용은 Python은 Tesseract 라이브러리를 사용하여 식별 확인을 구현합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!