近年來,隨著數位化進程的不斷推進,電子化文件的需求也越來越高。在實際工作中,我們常常需要將 HTML 文件轉換為 PDF 文件,在過程中需要使用到 Java 程式設計技術。本文將從以下三個面向介紹HTML 轉PDF 的Java 實作方法:
一、使用iText 進行HTML 轉PDF
iText 是一種流行的Java PDF 函式庫,它可以將HTML文件轉換為PDF 文件。 iText 的作用是解析 HTML 檔案並使用 PDF 標記語言來重構頁面。以下是使用 iText 進行 HTML 轉 PDF 的關鍵程式碼:
Document document = new Document(); PdfWriter writer = PdfWriter.getInstance(document, new FileOutputStream("output.pdf")); document.open(); HTMLWorker htmlWorker = new HTMLWorker(document); String html = "<html><head></head><body><p>Hello World</p></body></html>"; htmlWorker.parse(new StringReader(html)); document.close();
上述程式碼建立了一個 Document 物件用於 PDF 文件的生成,然後使用 PDFWriter 將該 Document 物件寫入輸出流中以生成 PDF 檔案。 HTMLWorker 然後用於解析 HTML 文件並將其新增至 PDF 頁面。最後,關閉 Document 物件以完成 PDF 文件的產生。
二、使用 Flying Saucer 進行 HTML 轉 PDF
另一個可用於 HTML 轉 PDF 的 Java 工具是 Flying Saucer。它是一個免費且開源的 PDF 渲染器,可以將 HTML 轉換為 PDF 格式的文件。以下是使用 Flying Saucer 進行 HTML 轉 PDF 的範例程式碼:
DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory.newInstance(); DocumentBuilder builder = documentBuilderFactory.newDocumentBuilder(); Document document = builder.parse(new InputSource(new StringReader(htmlContent))); ITextRenderer iTextRenderer = new ITextRenderer(); iTextRenderer.setDocument(document, null); iTextRenderer.layout(); OutputStream outputStream = new FileOutputStream("output.pdf"); iTextRenderer.createPDF(outputStream); outputStream.close();
上述程式碼首先解析 HTML 文件並將其讀入 Document 中。然後,使用 ITextRenderer 的 layout() 方法對文件進行佈局。最後,使用 createPDF() 方法將 PDF 檔案產生到 outputStream 中。
三、使用 PDFBox 進行 HTML 轉 PDF
PDFBox 是一個流行的開源 Java PDF 庫,提供了許多用於建立和處理 PDF 文件的工具。它還提供了一些 HTML 轉 PDF 的範例程式碼,可以在這裡看到完整的範例程式碼。
以下是使用 PDFBox 進行 HTML 轉 PDF 的範例程式碼:
PDDocument document = new PDDocument(); PDPage page = new PDPage(); document.addPage(page); PDPageContentStream contentStream = new PDPageContentStream(document, page); PDRectangle mediaBox = page.getMediaBox(); float margin = 72; float startX = mediaBox.getLowerLeftX() + margin; float startY = mediaBox.getUpperRightY() - margin; float width = mediaBox.getWidth() - 2 * margin; String html = "<html><head></head><body><p>Hello World!</p></body></html>"; ByteArrayInputStream bais = new ByteArrayInputStream(html.getBytes()); InputStreamReader isr = new InputStreamReader(bais); COSDocument cosDoc = new COSDocument(); PDFOperator.reset(); PDPageTree pageTree = new PDPageTree(); PDDOMParser parser = new PDDOMParser(cosDoc); parser.parse(isr); PDDocumentOutline outline = new PDDocumentOutline(); document.getDocumentCatalog().setDocumentOutline(outline.getRootNode()); PDOutlineItem item = new PDOutlineItem(); item.setTitle("PDFBox"); PDOutlineItem childItem = new PDOutlineItem(); childItem.setTitle("Hello World 2"); item.addLast(childItem); outline.getRootNode().addLast(item); PDAcroForm form = new PDAcroForm(cosDoc); document.getDocumentCatalog().setAcroForm(form); PDPageContentStream cs = new PDPageContentStream(document, page); PDFTextStripper stripper = new PDFTextStripper(); stripper.setStartPage(0); stripper.setEndPage(1); String text = stripper.getText(document); cs.beginText(); cs.setFont(PDType1Font.COURIER, 14); cs.drawString(text, 100, 100); cs.endText(); contentStream.close(); document.save("output.pdf"); document.close();
上述程式碼首先建立一個 PDDocument 對象,並向其添加了一個新頁面。然後,建立了一個 PDPageContentStream 對象,用於在頁面上繪製內容。接著,使用 PDDOMParser 將 HTML 解析為 COSDocument 物件。最後,將內容寫入輸出流以產生 PDF 檔案。
總結
HTML 轉 PDF 在實際生產過程中具有非常廣泛的應用,透過 Java 程式設計可以很方便地完成這個重要任務。本文介紹了使用 iText、Flying Saucer 和 PDFBox 三個工具進行 HTML 轉 PDF 的方法。無論是在什麼情況下,透過選擇最適合專案需求的方法,可以使開發變得更加快捷和便利。
以上是Java中怎麼將html轉為pdf的詳細內容。更多資訊請關注PHP中文網其他相關文章!