Heim  >  Artikel  >  Web-Frontend  >  nodejs konvertieren PDF in Word

nodejs konvertieren PDF in Word

WBOY
WBOYOriginal
2023-05-25 20:51:362088Durchsuche

Node.js ist eine sehr beliebte Open-Source-JavaScript-Laufzeitumgebung, die häufig für die serverseitige Programmierung verwendet wird. Es bietet viele leistungsstarke Funktionen, die es Entwicklern ermöglichen, viele verschiedene Arten von Aufgaben zu erledigen. Eine davon ist die Konvertierung von PDF-Dateien in Word-Dateien.

In diesem Artikel stellen wir die Schritte zum Konvertieren von PDF-Dateien in Word-Dateien mit Node.js vor. Wir müssen zwei Node.js-Bibliotheken verwenden: pdf2docx und docx. pdf2docx ist eine Bibliothek zum Konvertieren von PDF-Dateien in docx-Dateien, eine Bibliothek zur Verarbeitung von Word-Dokumenten.

Zuerst müssen wir diese beiden Bibliotheken installieren. Führen Sie den folgenden Befehl in der Befehlszeile aus, um sie zu installieren:

npm install pdf2docx
npm install docx

Als nächstes müssen wir Code schreiben, um PDF-Dateien zu verarbeiten. Wir können eine Datei namens „pdf2docx.js“ erstellen und den folgenden Code schreiben:

const fs = require('fs');
const { Converter } = require('pdf2docx');
const { Document, Paragraph } = require('docx');

const convertPdfToDocx = async (pdfFile, docxFile) => {
  const pdfData = fs.readFileSync(pdfFile);

  const converter = new Converter(pdfData);
  const docxData = await converter.convert();

  const doc = new Document();

  const paragraphs = docxData.split('
');
  paragraphs.forEach((paragraph) => {
    if (paragraph !== '') {
      doc.addParagraph(new Paragraph(paragraph));
    }
  });

  const buffer = await docx.Packer.toBuffer(doc);
  fs.writeFileSync(docxFile, buffer);
};

convertPdfToDocx('input.pdf', 'output.docx');

Dieses Code-Snippet definiert eine Funktion namens „convertPdfToDocx“, die zwei Parameter empfängt: den Pfad zur PDF-Datei und den Word-Dateipfad. Es liest zunächst die PDF-Datei und konvertiert sie mithilfe der pdf2docx-Bibliothek in das docx-Format. Anschließend erstellt es mithilfe der docx-Bibliothek ein neues Word-Dokumentobjekt und konvertiert die docx-Daten in eine Reihe von Absätzen. Schließlich werden diese Absätze zum Word-Dokumentobjekt hinzugefügt und als Word-Datei gespeichert.

Schließlich können wir den folgenden Befehl in der Befehlszeile ausführen, um die PDF-Datei in eine Word-Datei zu konvertieren:

node pdf2docx.js

Dadurch wird die Datei „input.pdf“ mithilfe des von uns geschriebenen Codes in eine Datei „output.docx“ konvertiert früher.

Zusammenfassend lässt sich sagen, dass es mit Node.js sehr einfach ist, PDF-Dateien in Word-Dateien zu konvertieren. Wir müssen die Bibliotheken pdf2docx und docx verwenden, um PDF-Dateien in das docx-Format zu konvertieren, und dann die docx-Bibliothek verwenden, um docx-Daten in Word-Dateien zu konvertieren. Wenn Sie eine Anwendung erstellen, die PDF- und Word-Dateien verarbeiten muss, ist Node.js eine sehr gute Wahl.

Das obige ist der detaillierte Inhalt vonnodejs konvertieren PDF in Word. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn