Rumah >pembangunan bahagian belakang >Golang >Kaedah praktikal untuk menukar fail PDF kepada dokumen Word dalam bahasa Go
PDF dan Word ialah dua format dokumen yang biasa digunakan dan mempunyai kegunaan berbeza dalam senario berbeza. Dokumen dalam format PDF mempunyai kelebihan keserasian merentas platform yang baik, keselamatan yang tinggi, dan penyimpanan dan penghantaran yang mudah, manakala dokumen dalam format Word mempunyai kelebihan kebolehsuntingan yang kuat, pengubahsuaian dan pemformatan yang mudah, dsb. Oleh itu, dalam beberapa kes, adalah perlu untuk menukar dokumen PDF kepada dokumen Word.
Bahasa Go ialah bahasa pengaturcaraan sumber terbuka, disusun dan tujuan umum dengan sintaks yang mudah, prestasi cemerlang dan keupayaan merentas platform yang kukuh. Bahasa Go menyediakan banyak perpustakaan dan alatan yang boleh menukar PDF kepada dokumen Word dengan mudah.
Pertama, kita perlu memasang perpustakaan tanggungan. Anda boleh menggunakan arahan berikut untuk memasang:
go get github.com/unidoc/unipdf/v2 go get github.com/unidoc/unioffice/v3
Dalam fail Go yang perlu menggunakan fungsi dokumen PDF ke Word, import perpustakaan bergantung:
import ( "github.com/unidoc/unipdf/v2/extractor" "github.com/unidoc/unioffice/v3" "github.com/unidoc/unioffice/v3/common" "github.com/unidoc/unioffice/v3/document" )
Gunakan unipdf code> perpustakaan untuk membaca dokumen PDF: unipdf
库读取PDF文档:
pdfReader, err := extractor.NewPdfReader(pdfFile) if err != nil { // Handle error } defer pdfReader.Close()
使用unioffice
库创建Word文档:
wordDoc := unioffice.NewDocument()
使用unipdf
和unioffice
pages, err := pdfReader.GetPages() if err != nil { // Handle error } for _, page := range pages { text, err := page.GetText() if err != nil { // Handle error } paragraph := wordDoc.AddParagraph() paragraph.AddRun().AddText(text) }4 Cipta dokumen Word Gunakan perpustakaan
unioffice
untuk membuat dokumen Word: err = wordDoc.SaveToFile(wordFile) if err != nil { // Handle error }5 kandungan Gunakan pustaka unipdf dan
unioffice
menukar kandungan dokumen PDF kepada kandungan dokumen Word: package main import ( "github.com/unidoc/unipdf/v2/extractor" "github.com/unidoc/unioffice/v3" "github.com/unidoc/unioffice/v3/common" "github.com/unidoc/unioffice/v3/document" ) func main() { // Read PDF document pdfFile := "path/to/input.pdf" pdfReader, err := extractor.NewPdfReader(pdfFile) if err != nil { // Handle error } defer pdfReader.Close() // Create Word document wordDoc := unioffice.NewDocument() // Convert PDF document content to Word document content pages, err := pdfReader.GetPages() if err != nil { // Handle error } for _, page := range pages { text, err := page.GetText() if err != nil { // Handle error } paragraph := wordDoc.AddParagraph() paragraph.AddRun().AddText(text) } // Save Word document wordFile := "path/to/output.docx" err = wordDoc.SaveToFile(wordFile) if err != nil { // Handle error } }
Atas ialah kandungan terperinci Kaedah praktikal untuk menukar fail PDF kepada dokumen Word dalam bahasa Go. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!