Heim  >  Artikel  >  Backend-Entwicklung  >  So führen Sie PDF-Dateien mit Python zusammen: Eine umfassende Anleitung

So führen Sie PDF-Dateien mit Python zusammen: Eine umfassende Anleitung

DDD
DDDOriginal
2024-10-23 08:30:29700Durchsuche

How to Merge PDF Files with Python: A Comprehensive Guide

PDF-Dateien mit Python zusammenführen

Python bietet leistungsstarke Optionen zum Zusammenführen von PDF-Dateien, sodass Sie mehrere Dokumente in einem einzigen, einheitlichen Dokument kombinieren können . Dieses Tutorial führt Sie durch den Prozess, einschließlich fortgeschrittener Techniken wie dem Durchlaufen von Verzeichnissen und dem Ausschließen bestimmter Seiten.

Verwenden der pypdf-Merging-Klasse

pypdf stellt die PdfMerger-Klasse bereit, die bietet eine einfache Möglichkeit, PDF-Dateien zu verketten und zusammenzuführen.

Dateiverkettung

Verketten Sie Dateien, indem Sie sie mit der Append-Methode anhängen:

<code class="python">import PdfMerger

pdfs = ['file1.pdf', 'file2.pdf', 'file3.pdf', 'file4.pdf']

merger = PdfMerger()

for pdf in pdfs:
    merger.append(pdf)

merger.write("result.pdf")</code>

Dateizusammenführung

Für eine genauere Kontrolle verwenden Sie die Zusammenführungsmethode, um Einfügepunkte anzugeben:

<code class="python">merger.merge(2, pdf)  # Insert PDF at page 2</code>

Seitenbereiche

Steuern Sie, welche Seiten angehängt werden, indem Sie das Schlüsselwortargument „pages“ verwenden:

<code class="python">merger.append(pdf, pages=(0, 3))  # Append first 3 pages
merger.append(pdf, pages=(0, 6, 2))  # Append pages 1, 3, 5</code>

Leere Seiten ausschließen

Um eine bestimmte Seite aus allen zusammengeführten PDFs auszuschließen, können Sie die Seiten manipulieren Parameter entsprechend anpassen. Um beispielsweise Seite 1 aus jedem PDF auszuschließen:

<code class="python">pages_to_exclude = [0]  # Page 1

for pdf in pdfs:
    merger.append(pdf, pages=(i for i in range(pages) if i not in pages_to_exclude))</code>

PyMuPdf-Bibliothek

Eine weitere Option ist die PyMuPdf-Bibliothek. So führen Sie PDFs damit zusammen:

Über die Befehlszeile

python -m fitz join -o result.pdf file1.pdf file2.pdf file3.pdf

Aus dem Code

<code class="python">import fitz

result = fitz.open()

for pdf in ['file1.pdf', 'file2.pdf', 'file3.pdf']:
    with fitz.open(pdf) as mfile:
        result.insert_pdf(mfile)
    result.save("result.pdf")</code>

Ordner durchlaufen

Um Ordner zu durchlaufen und PDFs zusammenzuführen, verwenden Sie das Betriebssystemmodul:

<code class="python">import os

for folder in os.listdir("path/to/directory"):
    pdfs = [f for f in os.listdir(f"path/to/directory/{folder}") if f.endswith(".pdf")]
    merger = PdfMerger()
    for pdf in pdfs:
        merger.append(f"path/to/directory/{folder}/{pdf}")
    merger.write(f"merged_{folder}.pdf")</code>

Das obige ist der detaillierte Inhalt vonSo führen Sie PDF-Dateien mit Python zusammen: Eine umfassende Anleitung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn