Maison > Article > interface Web > nodejs convertit un PDF en Word
Node.js est un environnement d'exécution JavaScript open source très populaire, couramment utilisé pour la programmation côté serveur. Il fournit de nombreuses fonctionnalités puissantes qui permettent aux développeurs d’effectuer de nombreux types de tâches différents. L'un d'eux consiste à convertir des fichiers PDF en fichiers Word.
Dans cet article, nous présenterons les étapes pour convertir des fichiers PDF en fichiers Word à l'aide de Node.js. Nous devons utiliser deux bibliothèques Node.js : pdf2docx et docx. pdf2docx est une bibliothèque pour convertir des fichiers PDF en fichiers docx, une bibliothèque pour traiter des documents Word.
Tout d’abord, nous devons installer ces deux bibliothèques. Exécutez la commande suivante dans la ligne de commande pour les installer :
npm install pdf2docx npm install docx
Ensuite, nous devons écrire du code pour traiter les fichiers PDF. On peut créer un fichier appelé "pdf2docx.js" et écrire le code suivant :
const fs = require('fs'); const { Converter } = require('pdf2docx'); const { Document, Paragraph } = require('docx'); const convertPdfToDocx = async (pdfFile, docxFile) => { const pdfData = fs.readFileSync(pdfFile); const converter = new Converter(pdfData); const docxData = await converter.convert(); const doc = new Document(); const paragraphs = docxData.split(' '); paragraphs.forEach((paragraph) => { if (paragraph !== '') { doc.addParagraph(new Paragraph(paragraph)); } }); const buffer = await docx.Packer.toBuffer(doc); fs.writeFileSync(docxFile, buffer); }; convertPdfToDocx('input.pdf', 'output.docx');
Cet extrait de code définit une fonction appelée "convertPdfToDocx" qui reçoit deux paramètres : le chemin du fichier PDF et le chemin du fichier Word. Il lit d'abord le fichier PDF et le convertit au format docx à l'aide de la bibliothèque pdf2docx. Il utilise ensuite la bibliothèque docx pour créer un nouvel objet document Word et convertit les données docx en une série de paragraphes. Enfin, il ajoute ces paragraphes à l'objet document Word et l'enregistre sous forme de fichier Word.
Enfin, nous pouvons exécuter la commande suivante dans la ligne de commande pour convertir le fichier PDF en fichier Word :
node pdf2docx.js
Cela convertira le fichier "input.pdf" en un fichier "output.docx" en utilisant le code que nous avons écrit plus tôt.
En conclusion, il est très simple de convertir des fichiers PDF en fichiers Word à l'aide de Node.js. Nous devons utiliser les bibliothèques pdf2docx et docx pour convertir les fichiers PDF au format docx, puis utiliser la bibliothèque docx pour convertir les données docx en fichiers Word. Si vous créez une application devant traiter des fichiers PDF et Word, Node.js est un très bon choix.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!