Maison >interface Web >Questions et réponses frontales >nodejs convertit un PDF en Word

nodejs convertit un PDF en Word

WBOY
WBOYoriginal
2023-05-25 20:51:362225parcourir

Node.js est un environnement d'exécution JavaScript open source très populaire, couramment utilisé pour la programmation côté serveur. Il fournit de nombreuses fonctionnalités puissantes qui permettent aux développeurs d’effectuer de nombreux types de tâches différents. L'un d'eux consiste à convertir des fichiers PDF en fichiers Word.

Dans cet article, nous présenterons les étapes pour convertir des fichiers PDF en fichiers Word à l'aide de Node.js. Nous devons utiliser deux bibliothèques Node.js : pdf2docx et docx. pdf2docx est une bibliothèque pour convertir des fichiers PDF en fichiers docx, une bibliothèque pour traiter des documents Word.

Tout d’abord, nous devons installer ces deux bibliothèques. Exécutez la commande suivante dans la ligne de commande pour les installer :

npm install pdf2docx
npm install docx

Ensuite, nous devons écrire du code pour traiter les fichiers PDF. On peut créer un fichier appelé "pdf2docx.js" et écrire le code suivant :

const fs = require('fs');
const { Converter } = require('pdf2docx');
const { Document, Paragraph } = require('docx');

const convertPdfToDocx = async (pdfFile, docxFile) => {
  const pdfData = fs.readFileSync(pdfFile);

  const converter = new Converter(pdfData);
  const docxData = await converter.convert();

  const doc = new Document();

  const paragraphs = docxData.split('
');
  paragraphs.forEach((paragraph) => {
    if (paragraph !== '') {
      doc.addParagraph(new Paragraph(paragraph));
    }
  });

  const buffer = await docx.Packer.toBuffer(doc);
  fs.writeFileSync(docxFile, buffer);
};

convertPdfToDocx('input.pdf', 'output.docx');

Cet extrait de code définit une fonction appelée "convertPdfToDocx" qui reçoit deux paramètres : le chemin du fichier PDF et le chemin du fichier Word. Il lit d'abord le fichier PDF et le convertit au format docx à l'aide de la bibliothèque pdf2docx. Il utilise ensuite la bibliothèque docx pour créer un nouvel objet document Word et convertit les données docx en une série de paragraphes. Enfin, il ajoute ces paragraphes à l'objet document Word et l'enregistre sous forme de fichier Word.

Enfin, nous pouvons exécuter la commande suivante dans la ligne de commande pour convertir le fichier PDF en fichier Word :

node pdf2docx.js

Cela convertira le fichier "input.pdf" en un fichier "output.docx" en utilisant le code que nous avons écrit plus tôt.

En conclusion, il est très simple de convertir des fichiers PDF en fichiers Word à l'aide de Node.js. Nous devons utiliser les bibliothèques pdf2docx et docx pour convertir les fichiers PDF au format docx, puis utiliser la bibliothèque docx pour convertir les données docx en fichiers Word. Si vous créez une application devant traiter des fichiers PDF et Word, Node.js est un très bon choix.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn