Heim >Backend-Entwicklung >Python-Tutorial >So führen Sie PDF-Dateien mit Python zusammen: Eine umfassende Anleitung
PDF-Dateien mit Python zusammenführen
Python bietet leistungsstarke Optionen zum Zusammenführen von PDF-Dateien, sodass Sie mehrere Dokumente in einem einzigen, einheitlichen Dokument kombinieren können . Dieses Tutorial führt Sie durch den Prozess, einschließlich fortgeschrittener Techniken wie dem Durchlaufen von Verzeichnissen und dem Ausschließen bestimmter Seiten.
Verwenden der pypdf-Merging-Klasse
pypdf stellt die PdfMerger-Klasse bereit, die bietet eine einfache Möglichkeit, PDF-Dateien zu verketten und zusammenzuführen.
Dateiverkettung
Verketten Sie Dateien, indem Sie sie mit der Append-Methode anhängen:
<code class="python">import PdfMerger pdfs = ['file1.pdf', 'file2.pdf', 'file3.pdf', 'file4.pdf'] merger = PdfMerger() for pdf in pdfs: merger.append(pdf) merger.write("result.pdf")</code>
Dateizusammenführung
Für eine genauere Kontrolle verwenden Sie die Zusammenführungsmethode, um Einfügepunkte anzugeben:
<code class="python">merger.merge(2, pdf) # Insert PDF at page 2</code>
Seitenbereiche
Steuern Sie, welche Seiten angehängt werden, indem Sie das Schlüsselwortargument „pages“ verwenden:
<code class="python">merger.append(pdf, pages=(0, 3)) # Append first 3 pages merger.append(pdf, pages=(0, 6, 2)) # Append pages 1, 3, 5</code>
Leere Seiten ausschließen
Um eine bestimmte Seite aus allen zusammengeführten PDFs auszuschließen, können Sie die Seiten manipulieren Parameter entsprechend anpassen. Um beispielsweise Seite 1 aus jedem PDF auszuschließen:
<code class="python">pages_to_exclude = [0] # Page 1 for pdf in pdfs: merger.append(pdf, pages=(i for i in range(pages) if i not in pages_to_exclude))</code>
PyMuPdf-Bibliothek
Eine weitere Option ist die PyMuPdf-Bibliothek. So führen Sie PDFs damit zusammen:
Über die Befehlszeile
python -m fitz join -o result.pdf file1.pdf file2.pdf file3.pdf
Aus dem Code
<code class="python">import fitz result = fitz.open() for pdf in ['file1.pdf', 'file2.pdf', 'file3.pdf']: with fitz.open(pdf) as mfile: result.insert_pdf(mfile) result.save("result.pdf")</code>
Ordner durchlaufen
Um Ordner zu durchlaufen und PDFs zusammenzuführen, verwenden Sie das Betriebssystemmodul:
<code class="python">import os for folder in os.listdir("path/to/directory"): pdfs = [f for f in os.listdir(f"path/to/directory/{folder}") if f.endswith(".pdf")] merger = PdfMerger() for pdf in pdfs: merger.append(f"path/to/directory/{folder}/{pdf}") merger.write(f"merged_{folder}.pdf")</code>
Das obige ist der detaillierte Inhalt vonSo führen Sie PDF-Dateien mit Python zusammen: Eine umfassende Anleitung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!