Maison >développement back-end >Golang >La lutte pour trouver un convertisseur Excel en PDF gratuit : mon parcours et ma solution
De nombreux projets nécessitent la conversion de fichiers Excel au format PDF, qu'il s'agisse de générer des rapports, de partager des données ou de créer des documents. Au départ, comme de nombreux développeurs, je pensais que ce serait une tâche facilement automatisée. Cependant, la recherche d’une solution gratuite et fiable est semée d’embûches : limitations, problèmes de compatibilité et outils commerciaux coûteux.
Finalement, j'ai surmonté ces difficultés et créé mon propre Convertisseur Excel en PDF et je l'ai rendu disponible en tant qu'outil open source à d'autres développeurs susceptibles d'être confrontés au même dilemme.
Les premiers résultats de recherche pointaient vers des solutions payantes telles que Aspose.Cells, Syncfusion et autres. Bien qu'ils soient puissants, leurs frais de licence sont élevés, ce qui les rend prohibitifs pour les petits projets ou les projets personnels.
Les convertisseurs en ligne gratuits semblent être un bon choix, mais ils ne sont pas adaptés à l'automatisation. Ces outils présentent souvent des problèmes de confidentialité (car les fichiers sont téléchargés sur des serveurs tiers), des limitations de taille de fichier et ne fournissent pas d'API de programmation.
J'ai également exploré les bibliothèques open source, mais la plupart manquaient de fonctionnalités pour convertir des fichiers Excel en PDF. Même les bibliothèques dotées de cette fonctionnalité sont souvent peu fiables ou ne prennent pas en charge les formats Microsoft Office modernes.
Après quelques semaines de recherche, je suis tombé sur un moyen d'utiliser LibreOffice en mode sans tête. LibreOffice est une suite bureautique gratuite et open source qui peut convertir plusieurs formats de fichiers, dont Excel, en PDF. Lorsqu'il fonctionne en mode sans tête, il fonctionne via la ligne de commande, ce qui le rend idéal pour l'automatisation.
Afin de faciliter l'utilisation par les développeurs, j'ai construit un serveur HTTP léger basé sur Go qui agit comme une API REST. Ce serveur encapsule les fonctionnalités de LibreOffice et permet à n'importe quel langage de programmation d'interagir avec lui via des requêtes HTTP.
Au lieu de m'appuyer sur le répertoire temporaire du système, j'ai choisi d'utiliser un répertoire ./tmp personnalisé. Cela garantit un comportement cohérent puisque les répertoires temporaires du système ont parfois des autorisations imprévisibles.
/convert
pour télécharger des fichiers Excel via des requêtes POST. Vous pouvez trouver le code source sur https://www.php.cn/link/5b1add8961a1cfa07e60838ffd0f83e7.
Ce projet fournit également une image Docker : wteja/pdf-converter.
<code>docker pull wteja/pdf-converter docker run -p 5000:5000 wteja/pdf-converter</code>
Étant donné que le service est exposé via HTTP, vous pouvez interagir avec lui en utilisant n'importe quel langage de programmation.
<code class="language-csharp">var client = new HttpClient(); var fileContent = new ByteArrayContent(File.ReadAllBytes("example.xlsx")); var formData = new MultipartFormDataContent { { fileContent, "file", "example.xlsx" } }; var response = await client.PostAsync("http://localhost:5000/convert", formData); var pdfBytes = await response.Content.ReadAsByteArrayAsync(); File.WriteAllBytes("output.pdf", pdfBytes);</code>
<code class="language-javascript">const axios = require("axios"); const FormData = require("form-data"); const fs = require("fs"); const form = new FormData(); form.append("file", fs.createReadStream("example.xlsx")); axios.post("http://localhost:5000/convert", form, { headers: form.getHeaders() }) .then(response => fs.writeFileSync("output.pdf", response.data)) .catch(console.error);</code>
<code class="language-python">import requests with open("example.xlsx", "rb") as f: response = requests.post("http://localhost:5000/convert", files={"file": f}) with open("output.pdf", "wb") as f: f.write(response.content)</code>
<code class="language-go">package main import ( "bytes" "io" "mime/multipart" "net/http" "os" ) func main() { file, _ := os.Open("example.xlsx") defer file.Close() body := &bytes.Buffer{} writer := multipart.NewWriter(body) part, _ := writer.CreateFormFile("file", "example.xlsx") io.Copy(part, file) writer.Close() req, _ := http.NewRequest("POST", "http://localhost:5000/convert", body) req.Header.Set("Content-Type", writer.FormDataContentType()) resp, _ := http.DefaultClient.Do(req) defer resp.Body.Close() out, _ := os.Create("output.pdf") defer out.Close() io.Copy(out, resp.Body) }</code>
En raison des dépendances de LibreOffice, la taille de l'image Docker est de 2,67 Go. Bien que j'aie testé des images plus petites telles qu'Alpine, elles contenaient des versions plus anciennes de LibreOffice qui n'étaient pas compatibles avec les formats Microsoft Office modernes. Bien que Debian fournisse la dernière version de LibreOffice, l'image générée est plus grande (environ 3 Go).
La taille d'image plus grande est un compromis acceptable par rapport au coût des solutions commerciales. Une fois configurée, l'image peut être réutilisée dans plusieurs projets sans payer de frais de licence supplémentaires.
La frustration de trouver un convertisseur Excel vers PDF gratuit m'a amené à créer ma propre solution en utilisant LibreOffice en mode sans tête. Même s'il n'est pas parfait, il est gratuit, fiable et flexible. Si vous êtes confronté au même défi, j'espère que ce projet vous fera gagner du temps et des efforts.
Veuillez consulter le projet sur GitHub ou extraire l'image Docker de Docker Hub. S'il vous plaît laissez-moi savoir comment cela fonctionne pour vous ou si vous avez des suggestions d'améliorations.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!