ホームページ >バックエンド開発 >Golang >PDF ファイルを Go 言語の Word ドキュメントに変換する実用的な方法

PDF ファイルを Go 言語の Word ドキュメントに変換する実用的な方法

王林
王林オリジナル
2024-01-31 18:07:06687ブラウズ

PDF ファイルを Go 言語の Word ドキュメントに変換する実用的な方法

Go 言語で PDF を Word ドキュメントに変換する実用的な方法

序文

PDF と Word は、さまざまなシナリオでよく使用される 2 つのドキュメント形式です。以下に異なる用途があります。 PDF 形式のドキュメントには、優れたクロスプラットフォーム互換性、高いセキュリティ、保存と送信が容易であるという利点があり、一方 Word 形式のドキュメントには、強力な編集可能性、簡単な変更と書式設定などの利点があります。したがって、場合によっては、PDF ドキュメントを Word ドキュメントに変換する必要があります。

Go 言語は PDF を Word 文書に変換します

Go 言語は、単純な構文、優れたパフォーマンス、および強力なクロスプラットフォーム機能を備えたオープンソースのコンパイル済み汎用プログラミング言語です。 Go 言語は、PDF を Word ドキュメントに簡単に変換できる豊富なライブラリとツールを提供します。

1. 依存関係のインストール

まず、依存ライブラリをインストールする必要があります。次のコマンドを使用してインストールできます:

go get github.com/unidoc/unipdf/v2
go get github.com/unidoc/unioffice/v3

2. 依存関係のインポート

PDF to Word ドキュメント機能を使用する必要がある Go ファイルで、依存ライブラリ:

import (
    "github.com/unidoc/unipdf/v2/extractor"
    "github.com/unidoc/unioffice/v3"
    "github.com/unidoc/unioffice/v3/common"
    "github.com/unidoc/unioffice/v3/document"
)
をインポートします。

3. PDF ドキュメントの取得を読み取ります

unipdf ライブラリを使用して PDF ドキュメントを読み取ります:

pdfReader, err := extractor.NewPdfReader(pdfFile)
if err != nil {
    // Handle error
}
defer pdfReader.Close()

4. Word ドキュメントを作成します

使用 unioffice ライブラリ Word ドキュメントを作成します:

wordDoc := unioffice.NewDocument()

5. PDF ドキュメント コンテンツを Word ドキュメント コンテンツに変換します

unipdf および unioffice ライブラリを使用しますPDF ドキュメントのコンテンツを変換する Word ドキュメントのコンテンツの場合:

pages, err := pdfReader.GetPages()
if err != nil {
    // Handle error
}

for _, page := range pages {
    text, err := page.GetText()
    if err != nil {
        // Handle error
    }

    paragraph := wordDoc.AddParagraph()
    paragraph.AddRun().AddText(text)
}

6. Word ドキュメントを保存します

Word ドキュメントをローカルに保存します:

err = wordDoc.SaveToFile(wordFile)
if err != nil {
    // Handle error
}

完全なコード例

package main

import (
    "github.com/unidoc/unipdf/v2/extractor"
    "github.com/unidoc/unioffice/v3"
    "github.com/unidoc/unioffice/v3/common"
    "github.com/unidoc/unioffice/v3/document"
)

func main() {
    // Read PDF document
    pdfFile := "path/to/input.pdf"
    pdfReader, err := extractor.NewPdfReader(pdfFile)
    if err != nil {
        // Handle error
    }
    defer pdfReader.Close()

    // Create Word document
    wordDoc := unioffice.NewDocument()

    // Convert PDF document content to Word document content
    pages, err := pdfReader.GetPages()
    if err != nil {
        // Handle error
    }

    for _, page := range pages {
        text, err := page.GetText()
        if err != nil {
            // Handle error
        }

        paragraph := wordDoc.AddParagraph()
        paragraph.AddRun().AddText(text)
    }

    // Save Word document
    wordFile := "path/to/output.docx"
    err = wordDoc.SaveToFile(wordFile)
    if err != nil {
        // Handle error
    }
}

概要

上記は、Go 言語を使用して PDF を Word 文書に変換する実用的な方法です。この記事が PDF を Word 文書に簡単に変換するのに役立つことを願っています。

以上がPDF ファイルを Go 言語の Word ドキュメントに変換する実用的な方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。