Rumah >pembangunan bahagian belakang >Golang >Bagaimana untuk menukar PDF kepada dokumen perkataan dalam bahasa Go

Bagaimana untuk menukar PDF kepada dokumen perkataan dalam bahasa Go

zbt
zbtasal
2023-12-13 15:24:141113semak imbas

Langkah-langkah untuk menukar PDF bahasa Go kepada dokumen perkataan adalah seperti berikut: 1. Tetapkan maklumat lesen 2. Buka fail PDF 3. Buat dokumen Word baharu 4. Lintas setiap halaman PDF dan tukar setiap halaman ke dalam imej. Dan masukkan imej ke dalam dokumen Word 5. Simpan dokumen Word.

Bagaimana untuk menukar PDF kepada dokumen perkataan dalam bahasa Go

Sistem pengendalian tutorial ini: sistem Windows 10, Go versi 1.21, komputer DELL G3.

Dalam bahasa Go, anda boleh menggunakan perpustakaan pihak ketiga untuk merealisasikan fungsi menukar PDF kepada dokumen Word. Pustaka yang biasa digunakan ialah github.com/unidoc/unipdf/v3.

Pertama, anda perlu mengimport perpustakaan dalam projek Go anda. Anda boleh menggunakan arahan berikut untuk memasang:

go get -u github.com/unidoc/unipdf/v3

Selepas pemasangan selesai, anda boleh memperkenalkan perpustakaan ke dalam kod anda:

import (
"fmt"
"github.com/unidoc/unipdf/v3/common/license"
"github.com/unidoc/unipdf/v3/convert"
"github.com/unidoc/unipdf/v3/core"
"github.com/unidoc/unipdf/v3/model"
)

Seterusnya, anda perlu menulis kod untuk melaksanakan fungsi dokumen PDF ke Word. Berikut ialah contoh kod mudah:

func main() {
// 设置许可证信息(可选)
license.SetLicenseFile("path/to/license/file.lic")
// 打开PDF文件
pdfReader, err := model.NewPdfReaderFromFile("path/to/input.pdf")
if err != nil {
fmt.Println("无法打开PDF文件:", err)
return
}
// 创建一个新的Word文档
doc := model.NewDocx()
// 遍历PDF的每一页
numPages, err := pdfReader.GetNumPages()
if err != nil {
fmt.Println("无法获取PDF页面数:", err)
return
}
for i := 1; i <= numPages; i++ {
// 获取当前页面
page, err := pdfReader.GetPage(i)
if err != nil {
fmt.Println("无法获取PDF页面:", err)
return
}
// 将PDF页面转换为图像
img, err := convert.PageToImage(page, 300) // 设置图像分辨率为300 DPI
if err != nil {
fmt.Println("无法将PDF页面转换为图像:", err)
return
}
// 将图像插入到Word文档中
doc.Add(img)
}
// 保存Word文档
err = doc.SaveToFile("path/to/output.docx")
if err != nil {
fmt.Println("无法保存Word文档:", err)
return
}
fmt.Println("PDF转Word文档成功!")
}

Kod di atas melakukan langkah berikut:

  • 1.

  • 2. Buka fail PDF.

  • 3. Cipta dokumen Word baharu.

  • 4 Lintas setiap halaman PDF, tukar setiap halaman menjadi imej dan masukkan imej ke dalam dokumen Word.

  • 5.

Sila ambil perhatian bahawa kod sampel ini hanya menunjukkan fungsi asas dokumen PDF ke Word dan mungkin tidak dapat mengendalikan beberapa fail PDF yang kompleks. Anda mungkin perlu mengubah suai dan mengoptimumkan kod berdasarkan keperluan sebenar.

Saya harap maklumat di atas dapat membantu anda merealisasikan fungsi menukar dokumen PDF kepada Word dalam bahasa Go.

Atas ialah kandungan terperinci Bagaimana untuk menukar PDF kepada dokumen perkataan dalam bahasa Go. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn