Maison >développement back-end >Tutoriel Python >Comment convertir des images en texte en python

Comment convertir des images en texte en python

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBavant: 2023-04-20 11:07:062192parcourir

image python en texte

En utilisant python + Tesseract-OCR pour créer un petit outil de conversion d'image en texte, la conception de l'interface graphique utilise le contrôle de la bibliothèque tkinter

Voir l'image ci-dessous pour l'interface et l'effet :

Comment convertir des images en texte en python

Problèmes avec

#进一步优化  1. 底部添加label   2.对识别后的文本处理，去空格


from PIL import Image as PImage
from PIL import ImageTk
import pytesseract
from tkinter import *
from tkinter import filedialog
from tkinter.scrolledtext import ScrolledText
import re

# 将图片内容翻译为文字，显示在文本框内
def trans():
    contents.delete(&#39;1.0&#39;, END)
    transTxt = pytesseract.image_to_string(PImage.open(filePath.get()),lang=&#39;chi_sim&#39;)
    #对transTxt进行处理  去空格，换行符去重
    transTxt = transTxt.strip(&#39;\n\r&#39;)   #无参数可以删除开头结尾的空格\n\t\r
    print(transTxt)
    contents.insert( INSERT, transTxt.replace(&#39; &#39;,&#39;&#39;).replace(&#39;\n\n&#39;,&#39;\n&#39;).replace(&#39;\r&#39;,&#39;&#39;))

#打开图片文件，显示路径，并将图片展现
def openfile():
    filename.delete(&#39;1.0&#39;, END)
    filePath.set(filedialog.askopenfilename())
    filename.insert(1.0,filePath.get())
    org_img = PImage.open(filePath.get())
    #调整图片显示大小 600*800
    w,h = org_img.size
    if w>600:
        h=int(h*600/w)
        w=600
    if h>800:
        w=int(w*800/h)
        h=800
    img = ImageTk.PhotoImage(org_img.resize((w,h)))
    showPic.config(image=img)
    showPic.image = img       #保持一个引用才能显示图片，tkinter的BUG
    

#设置主窗口
top = Tk()
top.title("OCR图片转文字  引擎：Tesseract-OCR  Made by: kaivis")
#top.iconbitmap("./pic/y1.ico")
top.geometry("1200x800")

filePath=StringVar()

bt_img1 = ImageTk.PhotoImage( file= "./pic/Outbox1.png")
bt_img2 = ImageTk.PhotoImage( file= "./pic/bt_img2.png")

#第一个窗体
frame1 = Frame (top, relief=RAISED, borderwidth=2)
frame1.pack(side=TOP, fill=BOTH,  ipady=5, expand=0)
Label(frame1,height=1,text="图片路径：").pack(side=LEFT)
filename = Text(frame1,height=2)
filename.pack(side=LEFT,padx=1, pady=0,expand=True, fill=X)
Button(frame1,text="打开文件", image=bt_img1, command=openfile).pack(side=LEFT,padx=5, pady=0)
Button(frame1,text="中文识别", image=bt_img2, command=trans).pack(side=LEFT,padx=5, pady=0)

#第二个窗体
frame2 = Frame (top, relief=RAISED, borderwidth=2)
frame2.pack (side=LEFT, fill=BOTH,  expand=1)
Label(frame2,text=&#39;图片显示：&#39;,borderwidth=5).pack(side=TOP,padx=20,pady=5)
showPic = Label(frame2,text=&#39;图片显示区&#39;)
showPic.pack(side=BOTTOM,expand=1,fill=BOTH)

#第三个窗体
frame3 = Frame (top)
frame3.pack (side=RIGHT, fill=BOTH,  expand=1)
#contents = ScrolledText(frame3)
Label(frame3,text=&#39;识别结果：&#39;,borderwidth=5).pack(side=TOP,padx=20,pady=10)
contents = Text(frame3,font=(&#39;Arial&#39;,15))
contents.pack(side=TOP,expand=1,fill=BOTH)
Label(frame3,text=&#39;Copyright 2021 baidu.com ALL Rights Reserved&#39;,borderwidth=5).pack(side=BOTTOM,padx=20,pady=10)

top.mainloop()

Le taux de reconnaissance n'est pas élevé, et il est encore plus difficile d'obtenir une grande précision pour les caractères chinois compacts. Existe-t-il un meilleur moteur OCR
? Le texte reconnu a été fait. En supprimant les espaces, le texte peut être encore optimisé, en particulier les sauts de ligne redondants qui doivent être traités

fonction de capture d'écran Python en texte

Lors de la recherche d'informations sur Internet, nous rencontrons souvent des situations où les articles ne peuvent pas être copiés Afin de pouvoir copier rapidement, je veux envoyer du texte, j'ai donc voulu écrire un programme python pour réaliser la fonction de conversion de captures d'écran en texte.

Comment convertir des images en texte en python

1. Idée

Tout d'abord, vous devez avoir la fonction d'enregistrement du clavier (faire savoir au programme que vous prenez une capture d'écran) - la bibliothèque de clavier doit recevoir l'image après avoir pris la capture d'écran - le La bibliothèque ImageGrab doit effectuer la reconnaissance de texte après avoir obtenu l'image - API de reconnaissance de texte Baidu AI

2. Implémenter

2.1 Importer les bibliothèques associées

Comment convertir des images en texte en python

2.2 Créer une classe et écrire une fonction pour enregistrer des captures d'écran

Étant donné que j'utilise le logiciel de capture d'écran fourni avec Win10, le raccourci clavier de capture d'écran est « ;win+shift+s’, vous pouvez le modifier librement en fonction de différents logiciels de capture d'écran.

Comment convertir des images en texte en python

2.3 Écrivez une fonction pour convertir des images en texte

Allez d'abord sur le site officiel de Baidu Smart Cloud pour demander une API de reconnaissance d'image.

Comment convertir des images en texte en python

Écrivez les paramètres dans le programme :

Comment convertir des images en texte en python

Écrivez la fonction de conversion de texte :

Comment convertir des images en texte en python

2.5 Créez une classe lors de l'exécution de

et appelez deux fonctions :

2.6 Effet Comment convertir des images en texte en python

Exécutez le programme et prenez une capture d'écran d'un article de la bibliothèque Baidu :

Les résultats sont les suivants :

Comment convertir des images en texte en python

Remarque : Comment convertir des images en texte en python

Il ressort des résultats en cours d'exécution de la version 2.6 que l'effet est toujours bon. Répond parfaitement à mes besoins actuels.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Python copy ocr

Déclaration：

Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer

Article précédent：Comment implémenter l'importation paresseuse-importation paresseuse de PythonArticle suivant：Comment implémenter l'importation paresseuse-importation paresseuse de Python

Articles Liés

Voir plus