Explication détaillée de l'exemple de code pour convertir des fichiers Word en fichiers HTML à l'aide de Java-javaDidacticiel-php.cn

Maison

Java

javaDidacticiel

Explication détaillée de l'exemple de code pour convertir des fichiers Word en fichiers HTML à l'aide de Java

黄舟

Mar 24, 2017 am 10:27 AM

Cet article présente principalement en détail la méthode de conversion des fichiers word en fichiers html en Java. Il a une certaine valeur de référence. Les amis intéressés peuvent s'y référer

Récemment, pendant le projet. développement, un utilisateur a proposé d'ouvrir un fichier Word dans un navigateur lorsqu'Office n'est pas installé sur l'ordinateur. La logique finale était la suivante : l'utilisateur sélectionne le fichier qu'il souhaite visualiser, et la page js détermine si le fichier est affiché. le fichier est un mot. Au lieu d'exécuter le téléchargement, le backend accède à la méthode de conversion correspondante basée sur le suffixe du fichier Word. Si le fichier existe déjà et que le fichier html correspondant existe, l'adresse du fichier html sera renvoyée directement. Si le fichier n'existe pas, le fichier html correspondant sera généré en premier puis l'adresse sera renvoyée. js ouvre directement un nouvel onglet via open() pour afficher le contenu du fichier Word. Je suis un débutant. S'il y a des erreurs dans le code ou s'il existe de meilleures implémentations, corrigez-moi !

Package de pots associé

Explication détaillée de l'exemple de code pour convertir des fichiers Word en fichiers HTML à l'aide de Java

Code

import java.io.ByteArrayOutputStream;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.OutputStream;

import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.transform.OutputKeys;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerException;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;

import org.apache.poi.hwpf.HWPFDocument;
import org.apache.poi.hwpf.converter.PicturesManager;
import org.apache.poi.hwpf.converter.WordToHtmlConverter;
import org.apache.poi.hwpf.usermodel.PictureType;
import org.apache.poi.xwpf.converter.core.BasicURIResolver;
import org.apache.poi.xwpf.converter.core.FileImageExtractor;
import org.apache.poi.xwpf.converter.core.FileURIResolver;
import org.apache.poi.xwpf.converter.xhtml.XHTMLConverter;
import org.apache.poi.xwpf.converter.xhtml.XHTMLOptions;
import org.apache.poi.xwpf.usermodel.XWPFDocument;
import org.w3c.dom.Document;

/**
 * word 转换成html 2017-2-27 
 */
public class WordToHtml {
  
  
  /**
   * 将word2003转换为html文件 2017-2-27 
   * @param wordPath word文件路径
   * @param wordName word文件名称无后缀
   * @param suffix  word文件后缀
   * @throws IOException
   * @throws TransformerException
   * @throws ParserConfigurationException
   */
  public String Word2003ToHtml(String wordPath,String wordName,String suffix) throws IOException, TransformerException, ParserConfigurationException {
    String htmlPath = wordPath + File.separator + wordName + "_show" + File.separator;
    String htmlName = wordName + ".html";
    final String imagePath = htmlPath + "image" + File.separator;
    
    //判断html文件是否存在
    File htmlFile = new File(htmlPath + htmlName);
    if(htmlFile.exists()){ 
      return htmlFile.getAbsolutePath();
    }
    
    //原word文档
    final String file = wordPath + File.separator + wordName + suffix;
    InputStream input = new FileInputStream(new File(file));
    
    HWPFDocument wordDocument = new HWPFDocument(input);
    WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument());
    //设置图片存放的位置
    wordToHtmlConverter.setPicturesManager(new PicturesManager() {
      public String savePicture(byte[] content, PictureType pictureType, String suggestedName, float widthInches, float heightInches) {
        File imgPath = new File(imagePath);
        if(!imgPath.exists()){//图片目录不存在则创建
          imgPath.mkdirs();
        }
        File file = new File(imagePath + suggestedName);
        try {
          OutputStream os = new FileOutputStream(file);
          os.write(content);
          os.close();
        } catch (FileNotFoundException e) {
          e.printStackTrace();
        } catch (IOException e) {
          e.printStackTrace();
        }
        //图片在html文件上的路径 相对路径
        return "image/" + suggestedName;
      }
    });
    
    //解析word文档
    wordToHtmlConverter.processDocument(wordDocument);
    Document htmlDocument = wordToHtmlConverter.getDocument();
    
    //生成html文件上级文件夹
    File folder = new File(htmlPath);
    if(!folder.exists()){ 
      folder.mkdirs(); 
    }
    
    //生成html文件地址
    OutputStream outStream = new FileOutputStream(htmlFile);

    DOMSource domSource = new DOMSource(htmlDocument);
    StreamResult streamResult = new StreamResult(outStream);

    TransformerFactory factory = TransformerFactory.newInstance();
    Transformer serializer = factory.newTransformer();
    serializer.setOutputProperty(OutputKeys.ENCODING, "utf-8");
    serializer.setOutputProperty(OutputKeys.INDENT, "yes");
    serializer.setOutputProperty(OutputKeys.METHOD, "html");
    
    serializer.transform(domSource, streamResult);

    outStream.close();
    
    return htmlFile.getAbsolutePath();
  }
  
  /**
   * 2007版本word转换成html 2017-2-27
   * @param wordPath word文件路径
   * @param wordName word文件名称无后缀
   * @param suffix  word文件后缀
   * @return
   * @throws IOException
   */
  public String Word2007ToHtml(String wordPath,String wordName,String suffix) throws IOException {
    String htmlPath = wordPath + File.separator + wordName + "_show" + File.separator;
    String htmlName = wordName + ".html";
    String imagePath = htmlPath + "image" + File.separator;
    
    //判断html文件是否存在
    File htmlFile = new File(htmlPath + htmlName);
    if(htmlFile.exists()){ 
      return htmlFile.getAbsolutePath();
    }
        
    //word文件
    File wordFile = new File(wordPath + File.separator + wordName + suffix); 
    
    // 1) 加载word文档生成 XWPFDocument对象 
    InputStream in = new FileInputStream(wordFile); 
    XWPFDocument document = new XWPFDocument(in); 

    // 2) 解析 XHTML配置 (这里设置IURIResolver来设置图片存放的目录) 
    File imgFolder = new File(imagePath);
    XHTMLOptions options = XHTMLOptions.create();
    options.setExtractor(new FileImageExtractor(imgFolder));
    //html中图片的路径 相对路径 
    options.URIResolver(new BasicURIResolver("image"));
    options.setIgnoreStylesIfUnused(false); 
    options.setFragment(true); 
    
    // 3) 将 XWPFDocument转换成XHTML
    //生成html文件上级文件夹
    File folder = new File(htmlPath);
    if(!folder.exists()){ 
      folder.mkdirs(); 
    }
    OutputStream out = new FileOutputStream(htmlFile); 
    XHTMLConverter.getInstance().convert(document, out, options);
    
    return htmlFile.getAbsolutePath(); 
  } 
}

Répertoire de fichiers :

Explication détaillée de l'exemple de code pour convertir des fichiers Word en fichiers HTML à l'aide de Java

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Article connexe

Quels aspects du développement de Java dépendent de la plate-forme?Apr 26, 2025 am 12:19 AM

JavadevelopmentSnotentivelyPlatform-indépendant de la duetoseveralfactors.1) jvmvariationSAffecctPerformanceAndbehavioracrossdifferentos.2) nativelibrarysviajniintroduceplatform-specificiss.3) goypathesystempropertiesdifferbetweenweenplateforms.4) goypathesmepropertiesdifferbetweenweenplateforms.4) guiaplicapropertiesdifferbetweenweenplateforms.4) guiaplicapropertiesdifferbetweenweenplateforms.4) guiaplicaaPropertiesdifferbetweenweenplateforms.4) GuiaplicaAplicaAplisses.

Existe-t-il des différences de performances lors de l'exécution du code Java sur différentes plates-formes? Pourquoi?Apr 26, 2025 am 12:15 AM

Java Code aura des différences de performances lors de l'exécution sur différentes plates-formes. 1) Les stratégies de mise en œuvre et d'optimisation de JVM sont différentes, comme OracleJDK et OpenJDK. 2) Les caractéristiques du système d'exploitation, telles que la gestion de la mémoire et la planification des threads, affecteront également les performances. 3) Les performances peuvent être améliorées en sélectionnant le JVM approprié, en ajustant les paramètres JVM et l'optimisation du code.

Quelles sont les limites de l'indépendance de la plate-forme de Java?Apr 26, 2025 am 12:10 AM

Java'splatformindependensencehaslimitations incluant la performance de la tête, les versions de verso, les défis avec l'intégration de la plate-forme spécifique et lajvminstallation / maintenance.

Expliquez la différence entre l'indépendance de la plate-forme et le développement multiplateforme.Apr 26, 2025 am 12:08 AM

Platform IndependeneNallowsProgramStorUnonanyPlatformWithoutModification, whilecross-plateformDevelopmentRequireStomePlatFatFor-SpecificAdjustments.

Comment la compilation Jit-Time (JIT) affecte-t-elle les performances et l'indépendance de la plate-forme de Java?Apr 26, 2025 am 12:02 AM

JitCompilationInjavaenHancesPerformance WhileSainingPlatForceLindependence.1) itdynynamicalTranslatesByTecodeIntOnAativemArnEcodeATrutime, OptimizingFrement UsedCode.2) thejvmremainsplatform-independent, permettant à la vigueur.

Pourquoi Java est-il un choix populaire pour développer des applications de bureau multiplateforme?Apr 25, 2025 am 12:23 AM

Javaispopularforcross-plateformdesktopapplicationsDuetoit "writeOnce, runanywhere" philosophy.1) iTUSESBYTECODETHATrunSonanyjvm-equipppatform.2) bibliothèqueslikeswingandjavafxhelpcreenative-lookporport

Discuter des situations où l'écriture de code spécifique à la plate-forme en Java pourrait être nécessaire.Apr 25, 2025 am 12:22 AM

Les raisons de l'écriture du code spécifique à la plate-forme en Java incluent l'accès à des fonctionnalités spécifiques du système d'exploitation, l'interaction avec le matériel spécifique et l'optimisation des performances. 1) Utilisez JNA ou JNI pour accéder au registre Windows; 2) interagir avec les pilotes matériels spécifiques à Linux via JNI; 3) Utilisez du métal pour optimiser les performances de jeu sur macOS via JNI. Néanmoins, la rédaction du code spécifique à la plate-forme peut affecter la portabilité du code, augmenter la complexité et potentiellement poser des risques de performances et de sécurité.

Quelles sont les tendances futures du développement de Java qui se rapportent à l'indépendance de la plate-forme?Apr 25, 2025 am 12:12 AM

Java améliorera encore l'indépendance des plates-formes grâce aux applications natives dans le cloud, au déploiement multi-plate-forme et à l'interopérabilité inter-language. 1) Les applications natives Cloud utiliseront Graalvm et Quarkus pour augmenter la vitesse de démarrage. 2) Java sera étendu aux appareils intégrés, aux appareils mobiles et aux ordinateurs quantiques. 3) Grâce à GraalVM, Java s'intègre de manière transparente à des langages tels que Python et JavaScript pour améliorer l'interopérabilité transversale.

See all articles

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Afficher plus

Article chaud

Assassin's Creed Shadows: Solution d'énigmes de coquille

4 Il y a quelques semainesByDDD

Quoi de neuf dans Windows 11 KB5054979 et comment résoudre les problèmes de mise à jour

3 Il y a quelques semainesByDDD

Où trouver la courte de la grue à atomide atomique

4 Il y a quelques semainesByDDD

<🎜>: Dead Rails - Comment relever chaque défi

1 Il y a quelques moisByDDD

Comment réparer KB5055523 ne parvient pas à s'installer dans Windows 11?

2 Il y a quelques semainesByDDD

Afficher plus

Outils chauds

VSCode Windows 64 bits Télécharger

Un éditeur IDE gratuit et puissant lancé par Microsoft

Télécharger la version Mac de l'éditeur Atom

L'éditeur open source le plus populaire

ZendStudio 13.5.1 Mac

Puissant environnement de développement intégré PHP

MinGW - GNU minimaliste pour Windows

Ce projet est en cours de migration vers osdn.net/projects/mingw, vous pouvez continuer à nous suivre là-bas. MinGW : un port Windows natif de GNU Compiler Collection (GCC), des bibliothèques d'importation et des fichiers d'en-tête librement distribuables pour la création d'applications Windows natives ; inclut des extensions du runtime MSVC pour prendre en charge la fonctionnalité C99. Tous les logiciels MinGW peuvent fonctionner sur les plates-formes Windows 64 bits.

DVWA

Damn Vulnerable Web App (DVWA) est une application Web PHP/MySQL très vulnérable. Ses principaux objectifs sont d'aider les professionnels de la sécurité à tester leurs compétences et leurs outils dans un environnement juridique, d'aider les développeurs Web à mieux comprendre le processus de sécurisation des applications Web et d'aider les enseignants/étudiants à enseigner/apprendre dans un environnement de classe. Application Web sécurité. L'objectif de DVWA est de mettre en pratique certaines des vulnérabilités Web les plus courantes via une interface simple et directe, avec différents degrés de difficulté. Veuillez noter que ce logiciel

Afficher plus

Sujets chauds

Où se trouve l’entrée de connexion pour la messagerie Gmail ?

7719

1641

1396

1289

1233