許多專案都需要將Excel檔案轉換為PDF格式,無論是產生報表、共用資料或建立文件。起初,我像許多開發者一樣,認為這將是一個易於自動化的任務。然而,尋找免費可靠的解決方案的歷程卻充滿挑戰:各種限制、相容性問題以及昂貴的商業工具。
最終,我克服了這些困難,建立了自己的Excel轉PDF轉換器,並將其作為開源工具提供給其他可能面臨同樣困境的開發者。
最初的搜尋結果指向了Aspose.Cells、Syncfusion等付費解決方案。雖然它們功能強大,但許可證費用高昂,對於小型或個人專案來說成本過高。
免費的線上轉換器似乎是一個不錯的選擇,但它們不適合自動化。這些工具通常存在隱私問題(因為檔案上傳到第三方伺服器)、檔案大小限制,且不提供程式設計API。
我還探索了開源函式庫,但大多數函式庫缺乏將Excel檔案轉換為PDF的功能。即使是那些具備此功能的函式庫,也往往不可靠或不支援現代Microsoft Office格式。
經過幾週的搜索,我偶然發現了使用無頭模式下的LibreOffice 的方法。 LibreOffice是一個免費的開源辦公室套件,可以將多種文件格式(包括Excel)轉換為PDF。在無頭模式下運行時,它會透過命令列操作,非常適合自動化。
為了方便開發者使用,我建立了一個輕量級的基於Go的HTTP伺服器,充當REST API。此伺服器封裝了LibreOffice的功能,並允許任何程式語言透過HTTP請求與之互動。
我沒有依賴系統的暫存目錄,而是選擇使用自訂的./tmp目錄。這確保了行為的一致性,因為系統暫存目錄有時權限不可預測。
/convert
端點上傳Excel檔案。 您可以在https://www.php.cn/link/5b1add8961a1cfa07e60838ffd0f83e7找到原始碼。
專案也提供Docker映像:wteja/pdf-converter。
<code>docker pull wteja/pdf-converter docker run -p 5000:5000 wteja/pdf-converter</code>
由於服務透過HTTP公開,您可以使用任何程式語言與之互動。
<code class="language-csharp">var client = new HttpClient(); var fileContent = new ByteArrayContent(File.ReadAllBytes("example.xlsx")); var formData = new MultipartFormDataContent { { fileContent, "file", "example.xlsx" } }; var response = await client.PostAsync("http://localhost:5000/convert", formData); var pdfBytes = await response.Content.ReadAsByteArrayAsync(); File.WriteAllBytes("output.pdf", pdfBytes);</code>
<code class="language-javascript">const axios = require("axios"); const FormData = require("form-data"); const fs = require("fs"); const form = new FormData(); form.append("file", fs.createReadStream("example.xlsx")); axios.post("http://localhost:5000/convert", form, { headers: form.getHeaders() }) .then(response => fs.writeFileSync("output.pdf", response.data)) .catch(console.error);</code>
<code class="language-python">import requests with open("example.xlsx", "rb") as f: response = requests.post("http://localhost:5000/convert", files={"file": f}) with open("output.pdf", "wb") as f: f.write(response.content)</code>
<code class="language-go">package main import ( "bytes" "io" "mime/multipart" "net/http" "os" ) func main() { file, _ := os.Open("example.xlsx") defer file.Close() body := &bytes.Buffer{} writer := multipart.NewWriter(body) part, _ := writer.CreateFormFile("file", "example.xlsx") io.Copy(part, file) writer.Close() req, _ := http.NewRequest("POST", "http://localhost:5000/convert", body) req.Header.Set("Content-Type", writer.FormDataContentType()) resp, _ := http.DefaultClient.Do(req) defer resp.Body.Close() out, _ := os.Create("output.pdf") defer out.Close() io.Copy(out, resp.Body) }</code>
由於LibreOffice的依賴項,Docker映像大小為2.67 GB。雖然我測試了Alpine等更小的鏡像,但它們包含的是舊版本的LibreOffice,與現代Microsoft Office格式不相容。 Debian雖然提供了最新的LibreOffice,但生成的鏡像更大(約3 GB)。
與商業解決方案的成本相比,較大的鏡像大小是可以接受的權衡。設定完成後,該鏡像可以在多個項目中重複使用,而無需支付額外的許可證費用。
尋找免費的Excel轉PDF轉換器的挫折感促使我使用無頭模式下的LibreOffice建立了自己的解決方案。雖然它並非完美無缺,但它是免費的、可靠的且靈活的。如果您面臨同樣的挑戰,我希望這個專案能為您節省時間和精力。
請在GitHub上查看該項目,或從Docker Hub拉取Docker映像。請告訴我它對您的效果如何,或者您是否有改進建議。
以上是尋找免費的 Excel 到 PDF 轉換器的鬥爭:我的旅程和解決方案的詳細內容。更多資訊請關注PHP中文網其他相關文章!