Rumah  >  Artikel  >  hujung hadapan web  >  nodejs menukar PDF kepada Word

nodejs menukar PDF kepada Word

WBOY
WBOYasal
2023-05-25 20:51:362088semak imbas

Node.js ialah persekitaran masa jalan JavaScript sumber terbuka yang sangat popular yang biasa digunakan untuk pengaturcaraan sebelah pelayan. Ia menyediakan banyak ciri berkuasa yang membolehkan pembangun menyelesaikan pelbagai jenis tugasan. Salah satunya ialah menukar fail PDF kepada fail Word.

Dalam artikel ini, kami akan memperkenalkan langkah-langkah untuk menukar fail PDF kepada fail Word menggunakan Node.js. Kita perlu menggunakan dua perpustakaan Node.js: pdf2docx dan docx. pdf2docx ialah perpustakaan untuk menukar fail PDF kepada fail docx, perpustakaan untuk memproses dokumen Word.

Pertama, kita perlu memasang kedua-dua perpustakaan ini. Jalankan arahan berikut dalam baris arahan untuk memasangnya:

npm install pdf2docx
npm install docx

Seterusnya, kita perlu menulis kod untuk memproses fail PDF. Kami boleh mencipta fail bernama "pdf2docx.js" dan menulis kod berikut:

const fs = require('fs');
const { Converter } = require('pdf2docx');
const { Document, Paragraph } = require('docx');

const convertPdfToDocx = async (pdfFile, docxFile) => {
  const pdfData = fs.readFileSync(pdfFile);

  const converter = new Converter(pdfData);
  const docxData = await converter.convert();

  const doc = new Document();

  const paragraphs = docxData.split('
');
  paragraphs.forEach((paragraph) => {
    if (paragraph !== '') {
      doc.addParagraph(new Paragraph(paragraph));
    }
  });

  const buffer = await docx.Packer.toBuffer(doc);
  fs.writeFileSync(docxFile, buffer);
};

convertPdfToDocx('input.pdf', 'output.docx');

Coretan kod ini mentakrifkan fungsi bernama "convertPdfToDocx" yang menerima dua parameter: laluan dan laluan ke fail Word. Ia mula-mula membaca fail PDF dan menukarnya kepada format docx menggunakan perpustakaan pdf2docx. Ia kemudian menggunakan perpustakaan docx untuk mencipta objek dokumen Word baharu dan menukar data docx kepada satu siri perenggan. Akhir sekali, ia menambahkan perenggan ini pada objek dokumen Word dan menyimpannya sebagai fail Word.

Akhir sekali, kita boleh menjalankan arahan berikut dalam baris arahan untuk menukar fail PDF kepada fail Word:

node pdf2docx.js

Ini akan menukar fail "input.pdf" kepada "output.docx "fail.

Ringkasnya, sangat mudah untuk menukar fail PDF kepada fail Word menggunakan Node.js. Kita perlu menggunakan perpustakaan pdf2docx dan docx untuk menukar fail PDF kepada format docx, dan kemudian menggunakan perpustakaan docx untuk menukar data docx kepada fail Word. Jika anda sedang membina aplikasi yang perlu memproses fail PDF dan Word, Node.js ialah pilihan yang sangat baik.

Atas ialah kandungan terperinci nodejs menukar PDF kepada Word. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn