Heim >Backend-Entwicklung >Golang >Eine praktische Methode zum Konvertieren von PDF-Dateien in Word-Dokumente in der Go-Sprache
PDF und Word sind zwei häufig verwendete Dokumentformate und werden in verschiedenen Szenarien unterschiedlich verwendet. Dokumente im PDF-Format bieten den Vorteil einer guten plattformübergreifenden Kompatibilität, hoher Sicherheit sowie einfacher Speicherung und Übertragung, während Dokumente im Word-Format die Vorteile einer guten Bearbeitbarkeit, einfachen Änderung und Formatierung usw. bieten. Daher ist es in manchen Fällen notwendig, PDF-Dokumente in Word-Dokumente zu konvertieren.
Go Language ist eine Open-Source-, kompilierte und universelle Programmiersprache mit einfacher Syntax, hervorragender Leistung und starken plattformübergreifenden Funktionen. Die Go-Sprache bietet eine Fülle von Bibliotheken und Tools, mit denen sich PDF-Dokumente problemlos in Word-Dokumente konvertieren lassen.
Zuerst müssen wir Abhängigkeitsbibliotheken installieren. Sie können zum Installieren den folgenden Befehl verwenden:
go get github.com/unidoc/unipdf/v2 go get github.com/unidoc/unioffice/v3
In der Go-Datei, die die PDF-zu-Word-Dokumentfunktion verwenden muss, importieren Sie die abhängige Bibliothek:
import ( "github.com/unidoc/unipdf/v2/extractor" "github.com/unidoc/unioffice/v3" "github.com/unidoc/unioffice/v3/common" "github.com/unidoc/unioffice/v3/document" )
Verwenden Sie unipdf code>-Bibliothek zum Lesen von PDF-Dokumenten: unipdf
库读取PDF文档:
pdfReader, err := extractor.NewPdfReader(pdfFile) if err != nil { // Handle error } defer pdfReader.Close()
使用unioffice
库创建Word文档:
wordDoc := unioffice.NewDocument()
使用unipdf
和unioffice
pages, err := pdfReader.GetPages() if err != nil { // Handle error } for _, page := range pages { text, err := page.GetText() if err != nil { // Handle error } paragraph := wordDoc.AddParagraph() paragraph.AddRun().AddText(text) }4. Erstellen Sie Word-Dokumente. Verwenden Sie die
unioffice
-Bibliothek, um Word-Dokumente zu erstellen: err = wordDoc.SaveToFile(wordFile) if err != nil { // Handle error }5 Inhalt Verwenden Sie unipdf- und
unioffice
-Bibliotheken, um PDF-Dokumentinhalte in Word-Dokumentinhalte zu konvertieren: package main import ( "github.com/unidoc/unipdf/v2/extractor" "github.com/unidoc/unioffice/v3" "github.com/unidoc/unioffice/v3/common" "github.com/unidoc/unioffice/v3/document" ) func main() { // Read PDF document pdfFile := "path/to/input.pdf" pdfReader, err := extractor.NewPdfReader(pdfFile) if err != nil { // Handle error } defer pdfReader.Close() // Create Word document wordDoc := unioffice.NewDocument() // Convert PDF document content to Word document content pages, err := pdfReader.GetPages() if err != nil { // Handle error } for _, page := range pages { text, err := page.GetText() if err != nil { // Handle error } paragraph := wordDoc.AddParagraph() paragraph.AddRun().AddText(text) } // Save Word document wordFile := "path/to/output.docx" err = wordDoc.SaveToFile(wordFile) if err != nil { // Handle error } }
Das obige ist der detaillierte Inhalt vonEine praktische Methode zum Konvertieren von PDF-Dateien in Word-Dokumente in der Go-Sprache. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!