ホームページ >ウェブフロントエンド >フロントエンドQ&A >nodejs が HTML を Word ドキュメントに変換する方法

nodejs が HTML を Word ドキュメントに変換する方法

PHPz
PHPzオリジナル
2023-04-06 08:53:001987ブラウズ

仕事では、履歴書やレポート ファイルを Web 形式から Word 形式に変換するなど、HTML 形式のドキュメントを Word ドキュメントに変換する必要があることがよくあります。従来の方法では、Microsoft Word などの有料ソフトウェアを使用して処理しますが、これらのソフトウェアは高価であり、さまざまな HTML タグやスタイルと完全な互換性はありません。この場合、Node.js を使用して HTML を Word に変換することを検討できます。

この記事では、Node.js とそれに関連する npm ライブラリを使用して HTML を Word ドキュメントに変換する方法を紹介します。

  1. 依存ライブラリのインストール

まず、いくつかの依存ライブラリをインストールする必要があります。ターミナルに次のコードを入力してインストールします:

npm install mammoth

インストールが完了したら、HTML を Word ドキュメントに変換するために mammoth を導入する必要があります。

  1. HTML を Docx に変換

次のコードを使用して、HTML ファイルを docx 形式の Word 文書に変換します。コード ConvertToHtml

メソッドは HTML ファイルを Word 形式の HTML に変換し、

convertToDocx メソッドを使用してそれを Word ドキュメントに変換できます。このプロセス中に、スタイル マッピング ルールを追加して、styleMap パラメーターを使用して、HTML のどのスタイルを Word 文書のスタイルにマップするかを指定することもできます。 完全なコード例

  1. 次は、HTML ファイルを Word ドキュメントに変換する方法を示す完全な例です。コード例では、input.html を Word ドキュメントに変換し、output.docx ファイルに保存します。
  2. const mammoth = require("mammoth");
    
    mammoth.convertToHtml({ path: "input.html"})
    .then((result) => {
      const options = {
        styleMap: [
          "p[style-name='Section Title'] => h1",
          "p[style-name='Subsection Title'] => h2"
        ]
      };
      return mammoth.convertToDocx({ buffer: result.value }, options);
    })
    .then((result) => {
      console.log(result);
    })
    .done();
上記のコードを実行して変換を完了すると、変換された Word 文書をoutput.docx ファイルに保存できます。

結論

この記事では、Node.js と関連する依存ライブラリを使用して HTML ファイルを Word ドキュメントに変換する方法を紹介します。 Node.js を使用する利点は、高価な有料ソフトウェアを回避できることと、カスタム スタイルのマッピングを実行できることです。仕事で HTML を Word に変換する必要がある場合は、Node.js メソッドを試してみるとよいでしょう。

以上がnodejs が HTML を Word ドキュメントに変換する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。