使用 PDFBox 将 PDF 文件转换为图像
Apache PDFBox 提供了一套全面的工具用于操作 PDF 文档,包括将其转换为图像。通过使用 PDFBox,您可以高效地将 PDF 文件的各个页面提取为单独的图像。
解决方案(版本 1.8.*):
PDDocument document = PDDocument.loadNonSeq(new File(pdfFilename), null); List<PDPage> pdPages = document.getDocumentCatalog().getAllPages(); int page = 0; for (PDPage pdPage : pdPages) { ++page; BufferedImage bim = pdPage.convertToImage(BufferedImage.TYPE_INT_RGB, 300); ImageIOUtil.writeImage(bim, pdfFilename + "-" + page + ".png", 300); } document.close();
解决方案(版本2.0):
PDDocument document = PDDocument.load(new File(pdfFilename)); PDFRenderer pdfRenderer = new PDFRenderer(document); for (int page = 0; page < document.getNumberOfPages(); ++page) { BufferedImage bim = pdfRenderer.renderImageWithDPI(page, 300, ImageType.RGB); ImageIOUtil.writeImage(bim, pdfFilename + "-" + (page+1) + ".png", 300); } document.close();
解决方案(3.0 版):
PDDocument document = Loader.loadPDF(new File(pdfFilename));
记住配置日志记录并使用可用的最新 JDK 版本。
以上是如何使用 PDFBox 将 PDF 文件转换为图像?的详细内容。更多信息请关注PHP中文网其他相关文章!