Kemahiran pembangunan Java didedahkan: Melaksanakan fungsi pemprosesan dokumen PDF
PDF (Format Dokumen Mudah Alih) ialah format dokumen elektronik yang digunakan secara meluas dengan kelebihan merentas platform, pemeliharaan format dan keselamatan. Dalam pembangunan Java, adalah keperluan biasa untuk melaksanakan fungsi memproses dokumen PDF. Artikel ini akan memperkenalkan beberapa teknik pembangunan Java untuk membantu pembangun melaksanakan fungsi pemprosesan dokumen PDF.
1. Import perpustakaan pemprosesan dokumen PDF
Dalam pembangunan Java, kami boleh menggunakan beberapa perpustakaan pihak ketiga untuk melaksanakan fungsi pemprosesan dokumen PDF, seperti iText, PDFBox, dsb. Perpustakaan ini menyediakan API yang kaya yang boleh membuat, membaca, mengubah suai dan mengekstrak kandungan daripada dokumen PDF dengan mudah.
Untuk menggunakan perpustakaan ini, kami perlu mengimport fail JAR yang sepadan ke dalam projek. Anda boleh memuat turun versi terkini fail JAR di tapak web rasmi dan menambahnya pada kebergantungan projek.
2. Cipta dokumen PDF
Gunakan perpustakaan iText untuk membuat dokumen PDF dengan mudah. Berikut ialah kod contoh mudah:
import com.itextpdf.text.Document; import com.itextpdf.text.DocumentException; import com.itextpdf.text.Paragraph; import com.itextpdf.text.pdf.PdfWriter; import java.io.FileNotFoundException; import java.io.FileOutputStream; public class CreatePDF { public static void main(String[] args) { Document document = new Document(); try { PdfWriter writer = PdfWriter.getInstance(document, new FileOutputStream("sample.pdf")); document.open(); document.add(new Paragraph("Hello World!")); document.close(); writer.close(); System.out.println("PDF created successfully!"); } catch (DocumentException | FileNotFoundException e) { e.printStackTrace(); } } }
Kod di atas mencipta dokumen PDF bernama "sample.pdf" dan menambahkan perenggan padanya.
3 Baca dokumen PDF
Gunakan perpustakaan PDFBox untuk membaca kandungan dokumen PDF dengan mudah. Berikut ialah kod contoh mudah:
import org.apache.pdfbox.pdmodel.PDDocument; import org.apache.pdfbox.text.PDFTextStripper; import java.io.File; import java.io.IOException; public class ReadPDF { public static void main(String[] args) { try { PDDocument document = PDDocument.load(new File("sample.pdf")); PDFTextStripper stripper = new PDFTextStripper(); String content = stripper.getText(document); System.out.println("PDF content: " + content); document.close(); } catch (IOException e) { e.printStackTrace(); } } }
Kod di atas membaca kandungan dokumen "sample.pdf" dan mencetaknya ke konsol.
4. Ubah suai dokumen PDF
Gunakan perpustakaan iText untuk mengubah suai kandungan dokumen PDF dengan mudah. Berikut ialah kod contoh mudah:
import com.itextpdf.text.Document; import com.itextpdf.text.DocumentException; import com.itextpdf.text.Paragraph; import com.itextpdf.text.pdf.PdfReader; import com.itextpdf.text.pdf.PdfStamper; import java.io.File; import java.io.FileOutputStream; import java.io.IOException; public class ModifyPDF { public static void main(String[] args) { try { PdfReader reader = new PdfReader("sample.pdf"); PdfStamper stamper = new PdfStamper(reader, new FileOutputStream("modified.pdf")); Paragraph paragraph = new Paragraph("Modified content"); stamper.getOverContent(1).add(paragraph); stamper.close(); reader.close(); System.out.println("PDF modified successfully!"); } catch (IOException | DocumentException e) { e.printStackTrace(); } } }
Kod di atas membuka dokumen "sample.pdf", menambahkan perenggan pada halaman pertama dan menyimpan dokumen yang diubah suai sebagai "modified.pdf".
5. Ekstrak kandungan dokumen PDF
Gunakan perpustakaan PDFBox untuk mengekstrak kandungan dokumen PDF dengan mudah. Berikut ialah kod contoh mudah:
import org.apache.pdfbox.pdmodel.PDDocument; import org.apache.pdfbox.text.PDFTextStripperByArea; import org.apache.pdfbox.text.TextPosition; import java.awt.*; import java.awt.geom.Rectangle2D; import java.io.File; import java.io.IOException; public class ExtractContent { public static void main(String[] args) { try { PDDocument document = PDDocument.load(new File("sample.pdf")); PDFTextStripperByArea stripper = new PDFTextStripperByArea() { @Override protected void writePage() throws IOException { // do nothing } @Override protected void writeString(String string, List<TextPosition> textPositions) throws IOException { for (TextPosition text : textPositions) { Rectangle2D.Float boundingBox = new Rectangle2D.Float(text.getX(), text.getY(), text.getWidth(), text.getHeight()); graphics.setColor(Color.RED); graphics.fill(boundingBox); } } }; stripper.extractRegions(document.getPage(0)); document.close(); } catch (IOException e) { e.printStackTrace(); } } }
Kod di atas mengekstrak kandungan daripada halaman pertama dokumen "sample.pdf" dan melukis segi empat tepat merah di sekeliling setiap aksara.
Ringkasan:
Artikel ini memperkenalkan beberapa teknik pembangunan Java untuk membantu pembangun melaksanakan fungsi pemprosesan dokumen PDF. Dengan mengimport perpustakaan pemprosesan dokumen PDF, mencipta, membaca, mengubah suai dan mengekstrak kandungan dalam dokumen PDF, kami boleh memproses dokumen PDF secara fleksibel untuk memenuhi pelbagai keperluan. Harap artikel ini membantu anda!
Atas ialah kandungan terperinci Kemahiran pembangunan Java didedahkan: Melaksanakan fungsi pemprosesan dokumen PDF. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!