首頁  >  文章  >  web前端  >  Java中怎麼將html轉為pdf

Java中怎麼將html轉為pdf

PHPz
PHPz原創
2023-04-21 11:27:5014384瀏覽

近年來,隨著數位化進程的不斷推進,電子化文件的需求也越來越高。在實際工作中,我們常常需要將 HTML 文件轉換為 PDF 文件,在過程中需要使用到 Java 程式設計技術。本文將從以下三個面向介紹HTML 轉PDF 的Java 實作方法:

一、使用iText 進行HTML 轉PDF

iText 是一種流行的Java PDF 函式庫,它可以將HTML文件轉換為PDF 文件。 iText 的作用是解析 HTML 檔案並使用 PDF 標記語言來重構頁面。以下是使用 iText 進行 HTML 轉 PDF 的關鍵程式碼:

Document document = new Document();
PdfWriter writer = PdfWriter.getInstance(document, new FileOutputStream("output.pdf"));
document.open();
HTMLWorker htmlWorker = new HTMLWorker(document);
String html = "<html><head></head><body><p>Hello World</p></body></html>";
htmlWorker.parse(new StringReader(html));
document.close();

上述程式碼建立了一個 Document 物件用於 PDF 文件的生成,然後使用 PDFWriter 將該 Document 物件寫入輸出流中以生成 PDF 檔案。 HTMLWorker 然後用於解析 HTML 文件並將其新增至 PDF 頁面。最後,關閉 Document 物件以完成 PDF 文件的產生。

二、使用 Flying Saucer 進行 HTML 轉 PDF

另一個可用於 HTML 轉 PDF 的 Java 工具是 Flying Saucer。它是一個免費且開源的 PDF 渲染器,可以將 HTML 轉換為 PDF 格式的文件。以下是使用 Flying Saucer 進行 HTML 轉 PDF 的範例程式碼:

DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = documentBuilderFactory.newDocumentBuilder();
Document document = builder.parse(new InputSource(new StringReader(htmlContent)));
ITextRenderer iTextRenderer = new ITextRenderer();
iTextRenderer.setDocument(document, null);
iTextRenderer.layout();
OutputStream outputStream = new FileOutputStream("output.pdf");
iTextRenderer.createPDF(outputStream);
outputStream.close();

上述程式碼首先解析 HTML 文件並將其讀入 Document 中。然後,使用 ITextRenderer 的 layout() 方法對文件進行佈局。最後,使用 createPDF() 方法將 PDF 檔案產生到 outputStream 中。

三、使用 PDFBox 進行 HTML 轉 PDF

PDFBox 是一個流行的開源 Java PDF 庫,提供了許多用於建立和處理 PDF 文件的工具。它還提供了一些 HTML 轉 PDF 的範例程式碼,可以在這裡看到完整的範例程式碼。

以下是使用 PDFBox 進行 HTML 轉 PDF 的範例程式碼:

PDDocument document = new PDDocument();
PDPage page = new PDPage();
document.addPage(page);
PDPageContentStream contentStream = new PDPageContentStream(document, page);
PDRectangle mediaBox = page.getMediaBox();
float margin = 72;
float startX = mediaBox.getLowerLeftX() + margin;
float startY = mediaBox.getUpperRightY() - margin;
float width = mediaBox.getWidth() - 2 * margin;
String html = "<html><head></head><body><p>Hello World!</p></body></html>";
ByteArrayInputStream bais = new ByteArrayInputStream(html.getBytes());
InputStreamReader isr = new InputStreamReader(bais);
COSDocument cosDoc = new COSDocument();
PDFOperator.reset();
PDPageTree pageTree = new PDPageTree();
PDDOMParser parser = new PDDOMParser(cosDoc);
parser.parse(isr);
PDDocumentOutline outline = new PDDocumentOutline();
document.getDocumentCatalog().setDocumentOutline(outline.getRootNode());
PDOutlineItem item = new PDOutlineItem();
item.setTitle("PDFBox");
PDOutlineItem childItem = new PDOutlineItem();
childItem.setTitle("Hello World 2");
item.addLast(childItem);
outline.getRootNode().addLast(item);
PDAcroForm form = new PDAcroForm(cosDoc);
document.getDocumentCatalog().setAcroForm(form);
PDPageContentStream cs = new PDPageContentStream(document, page);
PDFTextStripper stripper = new PDFTextStripper();
stripper.setStartPage(0);
stripper.setEndPage(1);
String text = stripper.getText(document);
cs.beginText();
cs.setFont(PDType1Font.COURIER, 14);
cs.drawString(text, 100, 100);
cs.endText();
contentStream.close();
document.save("output.pdf");
document.close();

上述程式碼首先建立一個 PDDocument 對象,並向其添加了一個新頁面。然後,建立了一個 PDPageContentStream 對象,用於在頁面上繪製內容。接著,使用 PDDOMParser 將 HTML 解析為 COSDocument 物件。最後,將內容寫入輸出流以產生 PDF 檔案。

總結

HTML 轉 PDF 在實際生產過程中具有非常廣泛的應用,透過 Java 程式設計可以很方便地完成這個重要任務。本文介紹了使用 iText、Flying Saucer 和 PDFBox 三個工具進行 HTML 轉 PDF 的方法。無論是在什麼情況下,透過選擇最適合專案需求的方法,可以使開發變得更加快捷和便利。

以上是Java中怎麼將html轉為pdf的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn