Heim >Backend-Entwicklung >Golang >Die Schwierigkeit, einen kostenlosen Excel-zu-PDF-Konverter zu finden: Meine Reise und Lösung

Die Schwierigkeit, einen kostenlosen Excel-zu-PDF-Konverter zu finden: Meine Reise und Lösung

DDD
DDDOriginal
2025-01-12 16:05:44252Durchsuche

The Struggle of Finding a Free Excel to PDF Converter: My Journey and Solution

Viele Projekte erfordern die Konvertierung von Excel-Dateien in das PDF-Format, sei es beim Erstellen von Berichten, beim Teilen von Daten oder beim Erstellen von Dokumenten. Anfangs dachte ich, wie viele Entwickler, dass dies eine leicht automatisierbare Aufgabe sein würde. Der Weg zu einer kostenlosen und zuverlässigen Lösung ist jedoch mit Herausforderungen verbunden: Einschränkungen, Kompatibilitätsprobleme und teure kommerzielle Tools.

Schließlich habe ich diese Schwierigkeiten überwunden und meinen eigenen Excel-zu-PDF-Konverter erstellt und ihn als Open-Source-Tool anderen Entwicklern zur Verfügung gestellt, die möglicherweise vor dem gleichen Dilemma stehen.


Frustrierende Erfahrung

Business-Tools

Erste Suchergebnisse wiesen auf kostenpflichtige Lösungen wie Aspose.Cells, Syncfusion und andere hin. Obwohl sie leistungsstark sind, sind ihre Lizenzgebühren hoch, was sie für kleine oder persönliche Projekte unerschwinglich macht.

Online-Dienste

Kostenlose Online-Konverter scheinen eine gute Wahl zu sein, sind aber nicht für die Automatisierung geeignet. Diese Tools haben häufig Datenschutzprobleme (da Dateien auf Server von Drittanbietern hochgeladen werden), Dateigrößenbeschränkungen und bieten keine Programmier-APIs.

Open-Source-Bibliothek

Ich habe auch Open-Source-Bibliotheken ausprobiert, aber den meisten fehlte die Funktionalität zum Konvertieren von Excel-Dateien in PDF. Selbst Bibliotheken, die über diese Funktion verfügen, sind oft unzuverlässig oder unterstützen keine modernen Microsoft Office-Formate.


LibreOffice im Headless-Modus

Nach ein paar Wochen der Suche bin ich auf eine Möglichkeit gestoßen, LibreOffice im Headless-Modus zu verwenden. LibreOffice ist eine kostenlose Open-Source-Office-Suite, die mehrere Dateiformate, einschließlich Excel, in PDF konvertieren kann. Im Headless-Modus erfolgt die Bedienung über die Befehlszeile, was es ideal für die Automatisierung macht.


So funktioniert meine Lösung

Um Entwicklern die Verwendung zu erleichtern, habe ich einen leichten Go-basierten HTTP-Server erstellt, der als REST-API fungiert. Dieser Server kapselt die Funktionalität von LibreOffice und ermöglicht jeder Programmiersprache die Interaktion mit ihm über HTTP-Anfragen.

Hauptfunktionen

  1. Unterstützt mehrere Dateiformate: Unterstützt .xlsx, .xls, .csv, .docx, .pptx und andere Formate.
  2. Automatische Bereinigung: Temporäre Dateien werden nach einer Stunde automatisch gelöscht, um Speicherplatz zu sparen.
  3. Benutzerdefinierte Schriftarten: Benutzerdefinierte Schriftarten können durch Klonen des GitHub-Repositorys oder mithilfe eines Docker-Volumes installiert werden.
  4. Sprachübergreifende Integration: Funktioniert mit jeder Programmiersprache, die HTTP unterstützt.

Temporäre Verzeichnismethode

Anstatt mich auf das temporäre Verzeichnis des Systems zu verlassen, habe ich mich für die Verwendung eines benutzerdefinierten ./tmp-Verzeichnisses entschieden. Dies stellt ein konsistentes Verhalten sicher, da temporäre Systemverzeichnisse manchmal unvorhersehbare Berechtigungen haben.


Implementierungsdetails

Workflow

  1. Datei-Upload: Der Client verwendet den /convert-Endpunkt, um Excel-Dateien über POST-Anfragen hochzuladen.
  2. Temporärer Speicher: Der Server speichert Dateien im Verzeichnis ./tmp mit Dateinamen basierend auf Zeitstempeln.
  3. Konvertieren: Rufen Sie LibreOffice im Headless-Modus auf, um die Datei in PDF zu konvertieren und das Ergebnis im selben Verzeichnis zu speichern.
  4. Dateibereinigung: Goroutine im Hintergrund löscht Dateien, die älter als eine Stunde sind.
  5. Antwort: Geben Sie das konvertierte PDF als HTTP-Antwort zurück.

Erste Schritte

GitHub-Repository

Den Quellcode finden Sie unter https://www.php.cn/link/5b1add8961a1cfa07e60838ffd0f83e7.

Docker-Image

Dieses Projekt stellt auch ein Docker-Image bereit: wteja/pdf-converter.

Docker-Container ausführen

<code>docker pull wteja/pdf-converter
docker run -p 5000:5000 wteja/pdf-converter</code>

Beispiele für die Integration mit anderen Sprachen

Da der Dienst über HTTP verfügbar gemacht wird, können Sie mit jeder Programmiersprache mit ihm interagieren.

C#

<code class="language-csharp">var client = new HttpClient();
var fileContent = new ByteArrayContent(File.ReadAllBytes("example.xlsx"));
var formData = new MultipartFormDataContent { { fileContent, "file", "example.xlsx" } };

var response = await client.PostAsync("http://localhost:5000/convert", formData);
var pdfBytes = await response.Content.ReadAsByteArrayAsync();
File.WriteAllBytes("output.pdf", pdfBytes);</code>

Node.js

<code class="language-javascript">const axios = require("axios");
const FormData = require("form-data");
const fs = require("fs");

const form = new FormData();
form.append("file", fs.createReadStream("example.xlsx"));

axios.post("http://localhost:5000/convert", form, { headers: form.getHeaders() })
  .then(response => fs.writeFileSync("output.pdf", response.data))
  .catch(console.error);</code>

Python

<code class="language-python">import requests

with open("example.xlsx", "rb") as f:
    response = requests.post("http://localhost:5000/convert", files={"file": f})

with open("output.pdf", "wb") as f:
    f.write(response.content)</code>

Los

<code class="language-go">package main

import (
    "bytes"
    "io"
    "mime/multipart"
    "net/http"
    "os"
)

func main() {
    file, _ := os.Open("example.xlsx")
    defer file.Close()

    body := &bytes.Buffer{}
    writer := multipart.NewWriter(body)
    part, _ := writer.CreateFormFile("file", "example.xlsx")
    io.Copy(part, file)
    writer.Close()

    req, _ := http.NewRequest("POST", "http://localhost:5000/convert", body)
    req.Header.Set("Content-Type", writer.FormDataContentType())

    resp, _ := http.DefaultClient.Do(req)
    defer resp.Body.Close()

    out, _ := os.Create("output.pdf")
    defer out.Close()
    io.Copy(out, resp.Body)
}</code>

Herausforderungen und Kompromisse

Bildgröße

Aufgrund von LibreOffice-Abhängigkeiten beträgt die Docker-Image-Größe 2,67 GB. Obwohl ich kleinere Images wie Alpine getestet habe, enthielten sie ältere Versionen von LibreOffice, die nicht mit modernen Microsoft Office-Formaten kompatibel waren. Obwohl Debian das neueste LibreOffice bereitstellt, ist das generierte Image größer (ca. 3 GB).

Warum es sich lohnt

Die größere Bildgröße ist ein akzeptabler Kompromiss im Vergleich zu den Kosten kommerzieller Lösungen. Einmal eingerichtet, kann das Bild in mehreren Projekten wiederverwendet werden, ohne dass zusätzliche Lizenzgebühren anfallen.


Fazit

Die Frustration, einen kostenlosen Excel-zu-PDF-Konverter zu finden, veranlasste mich, meine eigene Lösung mit LibreOffice im Headless-Modus zu erstellen. Es ist zwar nicht perfekt, aber kostenlos, zuverlässig und flexibel. Wenn Sie vor der gleichen Herausforderung stehen, hoffe ich, dass Ihnen dieses Projekt Zeit und Mühe erspart.

Bitte schauen Sie sich das Projekt auf GitHub an oder laden Sie das Docker-Image von Docker Hub herunter. Bitte teilen Sie mir mit, wie es bei Ihnen funktioniert oder ob Sie Verbesserungsvorschläge haben.

Das obige ist der detaillierte Inhalt vonDie Schwierigkeit, einen kostenlosen Excel-zu-PDF-Konverter zu finden: Meine Reise und Lösung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn