Python 可以合并 PDF 文件吗?
Python 提供了广泛的功能来操作 PDF 文档,包括合并。 Versatilepypdf 库提供了组合多个 PDF 文件的便捷工具。
文件串联
使用 PdfMerger 类的追加方法,按顺序串联文件:
<code class="python">from pypdf import PdfMerger pdfs = ['file1.pdf', 'file2.pdf', 'file3.pdf', 'file4.pdf'] merger = PdfMerger() for pdf in pdfs: merger.append(pdf) merger.write("result.pdf") merger.close()</code>
细粒度合并
为了获得更多控制,请使用合并方法在特定位置插入页面:
<code class="python">merger.merge(2, pdf)</code>
页面范围
使用pages关键字参数指定要从特定文件附加的页面范围:
<code class="python">merger.append(pdf, pages=(0, 3)) # first 3 pages merger.append(pdf, pages=(0, 6, 2)) # pages 1,3, 5</code>
处理空页面
排除每个 PDF 中都存在空白页,请使用 PyMuPdf 的 insert_pdf 方法:
<code class="python">import fitz result = fitz.open() for pdf in ['file1.pdf', 'file2.pdf', 'file3.pdf']: with fitz.open(pdf) as mfile: for page in mfile.pages: # Skip empty pages if page.get_text('blocks') != '': result.insert_page(len(result), page) result.save("merged_without_empty.pdf")</code>
以上是Python 可以使用 PyPDF 执行 PDF 文件合并和操作吗?的详细内容。更多信息请关注PHP中文网其他相关文章!