首頁 >後端開發 >Golang >尋找免費的 Excel 到 PDF 轉換器的鬥爭:我的旅程和解決方案

尋找免費的 Excel 到 PDF 轉換器的鬥爭:我的旅程和解決方案

DDD
DDD原創
2025-01-12 16:05:44252瀏覽

The Struggle of Finding a Free Excel to PDF Converter: My Journey and Solution

許多專案都需要將Excel檔案轉換為PDF格式,無論是產生報表、共用資料或建立文件。起初,我像許多開發者一樣,認為這將是一個易於自動化的任務。然而,尋找免費可靠的解決方案的歷程卻充滿挑戰:各種限制、相容性問題以及昂貴的商業工具。

最終,我克服了這些困難,建立了自己的Excel轉PDF轉換器,並將其作為開源工具提供給其他可能面臨同樣困境的開發者。


令人沮喪的經驗

商業工具

最初的搜尋結果指向了Aspose.Cells、Syncfusion等付費解決方案。雖然它們功能強大,但許可證費用高昂,對於小型或個人專案來說成本過高。

線上服務

免費的線上轉換器似乎是一個不錯的選擇,但它們不適合自動化。這些工具通常存在隱私問題(因為檔案上傳到第三方伺服器)、檔案大小限制,且不提供程式設計API。

開源函式庫

我還探索了開源函式庫,但大多數函式庫缺乏將Excel檔案轉換為PDF的功能。即使是那些具備此功能的函式庫,也往往不可靠或不支援現代Microsoft Office格式


無頭模式的LibreOffice

經過幾週的搜索,我偶然發現了使用無頭模式下的LibreOffice 的方法。 LibreOffice是一個免費的開源辦公室套件,可以將多種文件格式(包括Excel)轉換為PDF。在無頭模式下運行時,它會透過命令列操作,非常適合自動化。


我的解決方案的工作原理

為了方便開發者使用,我建立了一個輕量級的基於Go的HTTP伺服器,充當REST API。此伺服器封裝了LibreOffice的功能,並允許任何程式語言透過HTTP請求與之互動。

主要功能

  1. 支援多種檔案格式: 支援.xlsx、.xls、.csv、.docx、.pptx等多種格式。
  2. 自動清理: 臨時檔案在一小時後自動刪除,以節省磁碟空間。
  3. 自訂字型: 可以透過複製GitHub倉庫或使用Docker磁碟區來安裝自訂字型。
  4. 跨語言整合: 可與任何支援HTTP的程式語言一起使用。

臨時目錄方法

我沒有依賴系統的暫存目錄,而是選擇使用自訂的./tmp目錄。這確保了行為的一致性,因為系統暫存目錄有時權限不可預測。


實作細節

工作流程

  1. 檔案上傳: 用戶端透過POST要求,使用/convert端點上傳Excel檔案。
  2. 暫存: 伺服器將檔案儲存到./tmp目錄中,檔案名稱基於時間戳記。
  3. 轉換: 在無頭模式下呼叫LibreOffice將檔案轉換為PDF,並將結果儲存到同一目錄中。
  4. 檔案清理: 後台goroutine刪除超過一小時的檔案。
  5. 回應: 將轉換後的PDF作為HTTP回應傳回。

入門指南

GitHub倉庫

您可以在https://www.php.cn/link/5b1add8961a1cfa07e60838ffd0f83e7找到原始碼。

Docker映像

專案也提供Docker映像:wteja/pdf-converter

運行Docker容器

<code>docker pull wteja/pdf-converter
docker run -p 5000:5000 wteja/pdf-converter</code>

與其他語言整合的範例

由於服務透過HTTP公開,您可以使用任何程式語言與之互動。

C#

<code class="language-csharp">var client = new HttpClient();
var fileContent = new ByteArrayContent(File.ReadAllBytes("example.xlsx"));
var formData = new MultipartFormDataContent { { fileContent, "file", "example.xlsx" } };

var response = await client.PostAsync("http://localhost:5000/convert", formData);
var pdfBytes = await response.Content.ReadAsByteArrayAsync();
File.WriteAllBytes("output.pdf", pdfBytes);</code>

Node.js

<code class="language-javascript">const axios = require("axios");
const FormData = require("form-data");
const fs = require("fs");

const form = new FormData();
form.append("file", fs.createReadStream("example.xlsx"));

axios.post("http://localhost:5000/convert", form, { headers: form.getHeaders() })
  .then(response => fs.writeFileSync("output.pdf", response.data))
  .catch(console.error);</code>

Python

<code class="language-python">import requests

with open("example.xlsx", "rb") as f:
    response = requests.post("http://localhost:5000/convert", files={"file": f})

with open("output.pdf", "wb") as f:
    f.write(response.content)</code>

Go

<code class="language-go">package main

import (
    "bytes"
    "io"
    "mime/multipart"
    "net/http"
    "os"
)

func main() {
    file, _ := os.Open("example.xlsx")
    defer file.Close()

    body := &bytes.Buffer{}
    writer := multipart.NewWriter(body)
    part, _ := writer.CreateFormFile("file", "example.xlsx")
    io.Copy(part, file)
    writer.Close()

    req, _ := http.NewRequest("POST", "http://localhost:5000/convert", body)
    req.Header.Set("Content-Type", writer.FormDataContentType())

    resp, _ := http.DefaultClient.Do(req)
    defer resp.Body.Close()

    out, _ := os.Create("output.pdf")
    defer out.Close()
    io.Copy(out, resp.Body)
}</code>

挑戰與權衡

鏡像大小

由於LibreOffice的依賴項,Docker映像大小為2.67 GB。雖然我測試了Alpine等更小的鏡像,但它們包含的是舊版本的LibreOffice,與現代Microsoft Office格式不相容。 Debian雖然提供了最新的LibreOffice,但生成的鏡像更大(約3 GB)。

為什麼值得

與商業解決方案的成本相比,較大的鏡像大小是可以接受的權衡。設定完成後,該鏡像可以在多個項目中重複使用,而無需支付額外的許可證費用。


結論

尋找免費的Excel轉PDF轉換器的挫折感促使我使用無頭模式下的LibreOffice建立了自己的解決方案。雖然它並非完美無缺,但它是免費的、可靠的且靈活的。如果您面臨同樣的挑戰,我希望這個專案能為您節省時間和精力。

請在GitHub上查看該項目,或從Docker Hub拉取Docker映像。請告訴我它對您的效果如何,或者您是否有改進建議。

以上是尋找免費的 Excel 到 PDF 轉換器的鬥爭:我的旅程和解決方案的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn