Maison > Article > interface Web > poi html mot
Avec le développement continu des technologies de l'information sur Internet, nous avons de plus en plus besoin de convertir des pages HTML en documents Word pour l'édition, la composition, l'impression, etc. Cet article expliquera comment utiliser la bibliothèque POI pour convertir des pages HTML en documents Word et fournira quelques exemples de code pratiques.
1. Introduction à POI
POI est l'abréviation de "Poor Obfuscation Implementation". Il s'agit d'un projet open source sous Apache Software Foundation et s'engage à développer une API Java pour Microsoft Office (y compris Word, Excel, PowerPoint, etc.) . Actuellement, POI est devenu l'une des bibliothèques standard pour la création, la lecture/écriture de documents Microsoft Office en développement Java, et de nombreux programmes Java l'utilisent pour exploiter des documents Office.
2. Le processus de base de création d'un document Word avec POI
Avant d'utiliser POI pour créer un document Word, nous devons d'abord comprendre son processus de base de création d'un document Word.
Créez un document Word vide en utilisant la classe XWPFDocument fournie par POI.
XWPFDocument doc = new XWPFDocument();
L'exploitation du contenu des documents Word est implémentée via le XWPFParagraph et l'écriture de documents Word dans un fichier
Utilisez la méthode d'écriture fournie par la classe XWPFDocument pour écrire le document Word dans le fichier.XWPFParagraph para = doc.createParagraph();3. Convertir du HTML en document Word
Obtenir le contenu de la page HTML
Nous pouvons utiliser la classe URLConnection fournie par Java pour obtenir le contenu de la page HTML, comme indiqué ci-dessous :XWPFRun run = para.createRun(); run.setText("Hello World!");
FileOutputStream out = new FileOutputStream("output.docx"); doc.write(out); out.close();
String urlStr = "http://www.baidu.com"; URL url = new URL(urlStr); URLConnection conn = url.openConnection(); InputStream is = conn.getInputStream(); BufferedReader br = new BufferedReader(new InputStreamReader(is)); String line = null; StringBuffer sb = new StringBuffer(); while((line = br.readLine()) != null){ sb.append(line); } String html = sb.toString();(2) Obtenez tous les paragraphes de la page HTML
Document docHtml = Jsoup.parse(html);
XWPFDocument docx = new XWPFDocument();
Écrire le document Word sur le disque
Enfin, nous écrirons le document Word créé sur le disque pour une utilisation ultérieure.Elements parags = docHtml.getElementsByTag("p");4. Exemple de code complet
for(Element p : parags){ XWPFParagraph paragraph = docx.createParagraph();// 新建一个段落 XWPFRun run = paragraph.createRun();// 在该段落中创建一个文本片段,即 XWPFRun run.setText(p.text());// 设置该文本片段的文字内容 }
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!