ホームページ > 記事 > ウェブフロントエンド > nodejsはPDFをWordに変換します
Node.js は、サーバーサイド プログラミングによく使用される、非常に人気のあるオープン ソース JavaScript ランタイム環境です。開発者がさまざまな種類のタスクを実行できるようにする多くの強力な機能を提供します。その 1 つは、PDF ファイルを Word ファイルに変換することです。
この記事では、Node.jsを使用してPDFファイルをWordファイルに変換する手順を紹介します。 pdf2docx と docx という 2 つの Node.js ライブラリを使用する必要があります。 pdf2docx は、PDF ファイルを docx ファイルに変換するためのライブラリ、Word 文書を処理するためのライブラリです。
まず、これら 2 つのライブラリをインストールする必要があります。コマンド ラインで次のコマンドを実行してインストールします。
npm install pdf2docx npm install docx
次に、PDF ファイルを処理するコードを記述する必要があります。 「pdf2docx.js」という名前のファイルを作成し、次のコードを記述します。
const fs = require('fs'); const { Converter } = require('pdf2docx'); const { Document, Paragraph } = require('docx'); const convertPdfToDocx = async (pdfFile, docxFile) => { const pdfData = fs.readFileSync(pdfFile); const converter = new Converter(pdfData); const docxData = await converter.convert(); const doc = new Document(); const paragraphs = docxData.split(' '); paragraphs.forEach((paragraph) => { if (paragraph !== '') { doc.addParagraph(new Paragraph(paragraph)); } }); const buffer = await docx.Packer.toBuffer(doc); fs.writeFileSync(docxFile, buffer); }; convertPdfToDocx('input.pdf', 'output.docx');
このコード スニペットは、パスと Word ファイルへのパスの 2 つのパラメータを受け取る「convertPdfToDocx」という名前の関数を定義します。まず PDF ファイルを読み取り、pdf2docx ライブラリを使用して docx 形式に変換します。次に、docx ライブラリを使用して新しい Word 文書オブジェクトを作成し、docx データを一連の段落に変換します。最後に、これらの段落を Word 文書オブジェクトに追加し、Word ファイルとして保存します。
最後に、コマンド ラインで次のコマンドを実行して、PDF ファイルを Word ファイルに変換できます:
node pdf2docx.js
これは、前に作成したコードを使用して「input.pdf」を変換します。 " ファイルを "output.docx" ファイルに変換します。
つまり、Node.js を使用して PDF ファイルを Word ファイルに変換するのは非常に簡単です。 pdf2docx および docx ライブラリを使用して PDF ファイルを docx 形式に変換し、次に docx ライブラリを使用して docx データを Word ファイルに変換する必要があります。 PDF および Word ファイルを処理する必要があるアプリケーションを構築している場合、Node.js は非常に良い選択です。
以上がnodejsはPDFをWordに変換しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。