Maison  >  Article  >  Java  >  Compétences en développement Java révélées : implémentation de fonctions de traitement de documents PDF

Compétences en développement Java révélées : implémentation de fonctions de traitement de documents PDF

WBOY
WBOYoriginal
2023-11-20 13:45:341149parcourir

Compétences en développement Java révélées : implémentation de fonctions de traitement de documents PDF

Compétences en développement Java révélées : mise en œuvre des fonctions de traitement de documents PDF

PDF (Portable Document Format) est un format de document électronique largement utilisé avec les avantages de multiplateforme, de préservation du format et de sécurité. Dans le développement Java, il est courant d'implémenter la fonction de traitement des documents PDF. Cet article présentera quelques techniques de développement Java pour aider les développeurs à implémenter les fonctions de traitement de documents PDF.

1. Importer une bibliothèque de traitement de documents PDF

Dans le développement Java, nous pouvons utiliser certaines bibliothèques tierces pour implémenter des fonctions de traitement de documents PDF, telles que iText, PDFBox, etc. Ces bibliothèques fournissent des API riches qui peuvent facilement créer, lire, modifier et extraire du contenu à partir de documents PDF.

Pour utiliser ces bibliothèques, nous devons importer les fichiers JAR correspondants dans le projet. Vous pouvez télécharger la dernière version du fichier JAR sur le site officiel et l'ajouter aux dépendances du projet.

2. Créer des documents PDF

Utilisez la bibliothèque iText pour créer facilement des documents PDF. Voici un exemple de code simple :

import com.itextpdf.text.Document;
import com.itextpdf.text.DocumentException;
import com.itextpdf.text.Paragraph;
import com.itextpdf.text.pdf.PdfWriter;

import java.io.FileNotFoundException;
import java.io.FileOutputStream;

public class CreatePDF {
    public static void main(String[] args) {
        Document document = new Document();
        try {
            PdfWriter writer = PdfWriter.getInstance(document, new FileOutputStream("sample.pdf"));
            document.open();
            document.add(new Paragraph("Hello World!"));
            document.close();
            writer.close();
            System.out.println("PDF created successfully!");
        } catch (DocumentException | FileNotFoundException e) {
            e.printStackTrace();
        }
    }
}

Le code ci-dessus crée un document PDF nommé "sample.pdf" et y ajoute un paragraphe.

3. Lire des documents PDF

Utilisez la bibliothèque PDFBox pour lire facilement le contenu des documents PDF. Voici un exemple de code simple :

import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.text.PDFTextStripper;

import java.io.File;
import java.io.IOException;

public class ReadPDF {
    public static void main(String[] args) {
        try {
            PDDocument document = PDDocument.load(new File("sample.pdf"));
            PDFTextStripper stripper = new PDFTextStripper();
            String content = stripper.getText(document);
            System.out.println("PDF content: " + content);
            document.close();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

Le code ci-dessus lit le contenu du document "sample.pdf" et l'imprime sur la console.

4. Modifier des documents PDF

Utilisez la bibliothèque iText pour modifier facilement le contenu des documents PDF. Voici un exemple de code simple :

import com.itextpdf.text.Document;
import com.itextpdf.text.DocumentException;
import com.itextpdf.text.Paragraph;
import com.itextpdf.text.pdf.PdfReader;
import com.itextpdf.text.pdf.PdfStamper;

import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;

public class ModifyPDF {
    public static void main(String[] args) {
        try {
            PdfReader reader = new PdfReader("sample.pdf");
            PdfStamper stamper = new PdfStamper(reader, new FileOutputStream("modified.pdf"));
            Paragraph paragraph = new Paragraph("Modified content");
            stamper.getOverContent(1).add(paragraph);
            stamper.close();
            reader.close();
            System.out.println("PDF modified successfully!");
        } catch (IOException | DocumentException e) {
            e.printStackTrace();
        }
    }
}

Le code ci-dessus ouvre le document "sample.pdf", ajoute un paragraphe à la première page et enregistre le document modifié sous "modified.pdf".

5. Extraire le contenu du document PDF

Utilisez la bibliothèque PDFBox pour extraire facilement le contenu des documents PDF. Voici un exemple de code simple :

import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.text.PDFTextStripperByArea;
import org.apache.pdfbox.text.TextPosition;

import java.awt.*;
import java.awt.geom.Rectangle2D;
import java.io.File;
import java.io.IOException;

public class ExtractContent {
    public static void main(String[] args) {
        try {
            PDDocument document = PDDocument.load(new File("sample.pdf"));
            PDFTextStripperByArea stripper = new PDFTextStripperByArea() {
                @Override
                protected void writePage() throws IOException {
                    // do nothing
                }

                @Override
                protected void writeString(String string, List<TextPosition> textPositions) throws IOException {
                    for (TextPosition text : textPositions) {
                        Rectangle2D.Float boundingBox = new Rectangle2D.Float(text.getX(), text.getY(), text.getWidth(), text.getHeight());
                        graphics.setColor(Color.RED);
                        graphics.fill(boundingBox);
                    }
                }
            };
            stripper.extractRegions(document.getPage(0));
            document.close();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

Le code ci-dessus extrait le contenu de la première page du document "sample.pdf" et dessine un rectangle rouge autour de chaque caractère.

Résumé :

Cet article présente quelques techniques de développement Java pour aider les développeurs à implémenter la fonction de traitement des documents PDF. En important la bibliothèque de traitement de documents PDF, en créant, en lisant, en modifiant et en extrayant le contenu des documents PDF, nous pouvons traiter les documents PDF de manière flexible pour répondre à divers besoins. J'espère que cet article vous aidera !

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn