>  기사  >  웹 프론트엔드  >  Java에서 HTML을 PDF로 변환하는 방법

Java에서 HTML을 PDF로 변환하는 방법

PHPz
PHPz원래의
2023-04-21 11:27:5014474검색

최근에는 디지털화가 지속적으로 진행되면서 전자문서에 대한 수요가 점점 더 높아지고 있습니다. 실제 작업에서는 HTML 파일을 PDF 파일로 변환해야 하는 경우가 종종 있는데, 이 과정에서 Java 프로그래밍 기술을 사용해야 합니다. 이 기사에서는 다음 세 가지 측면에서 HTML을 PDF로 변환하는 Java 구현 방법을 소개합니다.

1. iText를 사용하여 HTML을 PDF로 변환

iText는 HTML 파일을 PDF 파일로 변환할 수 있는 인기 있는 Java PDF 라이브러리입니다. iText는 HTML 파일을 구문 분석하고 PDF 마크업 언어를 사용하여 페이지를 재구성합니다. 다음은 iText를 사용하여 HTML을 PDF로 변환하기 위한 키 코드입니다.

Document document = new Document();
PdfWriter writer = PdfWriter.getInstance(document, new FileOutputStream("output.pdf"));
document.open();
HTMLWorker htmlWorker = new HTMLWorker(document);
String html = "<html><head></head><body><p>Hello World</p></body></html>";
htmlWorker.parse(new StringReader(html));
document.close();

위 코드는 PDF 파일 생성을 위한 Document 객체를 생성한 다음 PDFWriter를 사용하여 Document 객체를 출력 스트림에 작성하여 PDF 파일을 생성합니다. 그런 다음 HTMLWorker를 사용하여 HTML 문서를 구문 분석하고 PDF 페이지에 추가합니다. 마지막으로 Document 개체를 닫아 PDF 파일 생성을 완료합니다.

2. Flying Saucer를 사용하여 HTML을 PDF로 변환

HTML을 PDF로 변환하는 데 사용할 수 있는 또 다른 Java 도구는 Flying Saucer입니다. HTML을 PDF 형식 문서로 변환할 수 있는 무료 오픈 소스 PDF 렌더러입니다. 다음은 Flying Saucer를 사용하여 HTML을 PDF로 변환하는 샘플 코드입니다.

DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = documentBuilderFactory.newDocumentBuilder();
Document document = builder.parse(new InputSource(new StringReader(htmlContent)));
ITextRenderer iTextRenderer = new ITextRenderer();
iTextRenderer.setDocument(document, null);
iTextRenderer.layout();
OutputStream outputStream = new FileOutputStream("output.pdf");
iTextRenderer.createPDF(outputStream);
outputStream.close();

위 코드는 먼저 HTML 문서를 파싱하여 Document로 읽어옵니다. 그런 다음 ITextRenderer의 레이아웃() 메서드를 사용하여 문서의 레이아웃을 지정합니다. 마지막으로 createPDF() 메서드를 사용하여 PDF 파일을 outputStream에 생성합니다.

3. PDFBox를 사용하여 HTML을 PDF로 변환

PDFBox는 PDF 파일 생성 및 처리를 위한 다양한 도구를 제공하는 인기 있는 오픈 소스 Java PDF 라이브러리입니다. 또한 일부 HTML-PDF 샘플 코드도 제공하며 전체 샘플 코드는 여기에서 볼 수 있습니다.

다음은 PDFBox를 사용하여 HTML을 PDF로 변환하기 위한 샘플 코드입니다.

PDDocument document = new PDDocument();
PDPage page = new PDPage();
document.addPage(page);
PDPageContentStream contentStream = new PDPageContentStream(document, page);
PDRectangle mediaBox = page.getMediaBox();
float margin = 72;
float startX = mediaBox.getLowerLeftX() + margin;
float startY = mediaBox.getUpperRightY() - margin;
float width = mediaBox.getWidth() - 2 * margin;
String html = "<html><head></head><body><p>Hello World!</p></body></html>";
ByteArrayInputStream bais = new ByteArrayInputStream(html.getBytes());
InputStreamReader isr = new InputStreamReader(bais);
COSDocument cosDoc = new COSDocument();
PDFOperator.reset();
PDPageTree pageTree = new PDPageTree();
PDDOMParser parser = new PDDOMParser(cosDoc);
parser.parse(isr);
PDDocumentOutline outline = new PDDocumentOutline();
document.getDocumentCatalog().setDocumentOutline(outline.getRootNode());
PDOutlineItem item = new PDOutlineItem();
item.setTitle("PDFBox");
PDOutlineItem childItem = new PDOutlineItem();
childItem.setTitle("Hello World 2");
item.addLast(childItem);
outline.getRootNode().addLast(item);
PDAcroForm form = new PDAcroForm(cosDoc);
document.getDocumentCatalog().setAcroForm(form);
PDPageContentStream cs = new PDPageContentStream(document, page);
PDFTextStripper stripper = new PDFTextStripper();
stripper.setStartPage(0);
stripper.setEndPage(1);
String text = stripper.getText(document);
cs.beginText();
cs.setFont(PDType1Font.COURIER, 14);
cs.drawString(text, 100, 100);
cs.endText();
contentStream.close();
document.save("output.pdf");
document.close();

위 코드는 먼저 PDDocument 개체를 생성하고 여기에 새 페이지를 추가합니다. 그런 다음 페이지에 콘텐츠를 그리는 데 사용되는 PDPageContentStream 개체가 만들어집니다. 다음으로 PDDOMParser를 사용하여 HTML을 COSDocument 개체로 구문 분석합니다. 마지막으로 콘텐츠가 출력 스트림에 기록되어 PDF 파일을 생성합니다.

요약

HTML to PDF는 실제 생산 과정에서 매우 광범위한 응용 프로그램을 가지고 있으며 이 중요한 작업은 Java 프로그래밍을 통해 쉽게 완료할 수 있습니다. 이 기사에서는 iText, Flying Saucer 및 PDFBox의 세 가지 도구를 사용하여 HTML을 PDF로 변환하는 방법을 소개합니다. 상황이 무엇이든 프로젝트 요구 사항에 가장 적합한 방법을 선택하면 개발이 더 빠르고 편리해질 수 있습니다.

위 내용은 Java에서 HTML을 PDF로 변환하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.