Heim >Backend-Entwicklung >Python-Tutorial >Das Extrahieren von PPT-Text und das Übertragen in Word wird zum Kinderspiel und erfordert nur 20 Zeilen Python-Code!
Hallo zusammen, ich bin ein Neuling! Heute möchte ich ein sehr praktisches Python-Programm mit Ihnen teilen.
Viele Freunde, ob in der Schule oder bei der Arbeit, werden auf ein Problem stoßen, nämlich den Text aus der PPT zu extrahieren und in Word zu speichern, was ihnen das Lesen oder Kopieren des Textes erleichtern kann aus. Aber oft können Freunde den Text im PPT nur einzeln durch Kopieren und Einfügen extrahieren. Diese Arbeitsweise ist zweifellos sehr ineffizient Heute stellt Ihnen Rookie Brother eine neue Methode vor, mit der Sie Text stapelweise aus PPT extrahieren und in einem Word-Dokument speichern können .
Ich habe zum Beispiel so einen PPT-Inhalt, der viel Text und Bilder enthält, vor allem an Aufsätzen oder einigen wichtigen Themen Im ppt des wissenschaftlichen Berichts muss viel Text extrahiert und analysiert werden. Lassen Sie mich ein Beispiel für eine einfache PPT-Seite geben:
Wie Sie sehen können, enthält die PPT oben einige Text- und Bildinhaltsinformationen, aber ich möchte nur den Text extrahieren. Tatsächlich kann dies der Fall sein ganz einfach mit Python gemacht, schauen Sie sich den Endeffekt an:
Der Effekt ist nicht schlecht, er ist eigentlich sehr einfach, schauen wir uns an, wie es geht.
Wir verwenden hauptsächlich die python-pptx-Bibliothek und die python-docx-Bibliothek. Wird für die Verarbeitung von PPT-Dateien bzw. Word-Dateien verwendet. Sie können es direkt mit pip3 installieren. Der Kerncode ist wie folgt:
Der Code ist tatsächlich sehr kurz um es für alle besser zu machen. Um dieses Programm zu verstehen, können Sie es mit dem Bild unten kombinieren, um es einzeln zu erklären.
Im Programm verwenden wir insgesamt 3 Schleifenebenen zur Verarbeitung:
1). Die erste Ebene der for-Schleife wird zum Durchlaufen der Folien jeder Seite verwendet ;
2) bestimmt jede Form in der Folie und bestimmt dann, ob die Seite ein Textfeld enthält, und benenne es text_frame.
3). Die dritte for-Schleife durchläuft den gesamten Absatzinhalt im Textfeld, extrahiert den Text und speichert ihn in Word.
Speichern Sie nach dem Durchsuchen der gesamten PPT-Datei alle extrahierten Textinformationen in einem lokalen Word-Dokument. Der Effekt ist wie im Bild unten dargestellt:
Die PPT-Datei im Bild oben enthält vier Folien mit Text. Nach dem Ausführen des Programms werden die Ergebnisse der Textextraktion in der folgenden Abbildung dargestellt.Das Obige ist die automatisierte Fallfreigabe, die Rookie Ihnen heute zur Verfügung gestellt hat. Mit nur wenigen Codezeilen kann die Arbeitseffizienz aller erheblich verbessert werden. Sie können das Programm auch für eine schnelle Extraktion verwenden.
Das obige ist der detaillierte Inhalt vonDas Extrahieren von PPT-Text und das Übertragen in Word wird zum Kinderspiel und erfordert nur 20 Zeilen Python-Code!. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!