使用 Python 合并 PDF 文件
文件串联
使用 PyPDF 的 PdfMerger 类,您可以只需附加 PDF 文件即可连接它们:
<code class="python">from pypdf import PdfMerger pdfs = ['file1.pdf', 'file2.pdf', 'file3.pdf'] merger = PdfMerger() for pdf in pdfs: merger.append(pdf) merger.write("result.pdf") merger.close()</code>
文件合并
为了进行更精细的控制,请使用 PdfMerger 的合并方法指定输出文件中的插入点:
<code class="python">merger.merge(2, pdf)</code>
这会在输出的第 2 页插入整个 PDF。
页面范围
要控制合并哪些页面,请使用 Pages 关键字参数:
<code class="python">merger.append(pdf, pages=(0, 3)) # first 3 pages merger.append(pdf, pages=(0, 6, 2)) # pages 1,3, 5</code>
排除特定页面
要排除所有 PDF 中出现的特定页面,您需要遍历每个页面并检查它是否额外的空白页:
<code class="python">for i in range(len(pdfs)): num_pages = merger.getPageNumber(i) for page_num in range(num_pages): page = merger.getPage(i, page_num) # Check if page is the extra blank page and exclude it exclude = True if exclude: merger.deletePage(i, page_num)</code>
其他工具
PyMuPDF:通过命令行或代码合并PDF:
python -m fitz join -o result.pdf file1.pdf file2.pdf file3.pdf
注意:记得调用 PdfMerger 的 close() 方法以确保所有文件都正确关闭。
以上是如何使用Python脚本技术合并PDF文件?的详细内容。更多信息请关注PHP中文网其他相关文章!