搜索
首页后端开发Golang寻找免费的 Excel 到 PDF 转换器的斗争:我的旅程和解决方案

The Struggle of Finding a Free Excel to PDF Converter: My Journey and Solution

许多项目都需要将Excel文件转换为PDF格式,无论是生成报表、共享数据还是创建文档。起初,我像许多开发者一样,认为这将是一个易于自动化的任务。然而,寻找免费可靠的解决方案的历程却充满挑战:各种限制、兼容性问题以及昂贵的商业工具。

最终,我克服了这些困难,构建了自己的Excel转PDF转换器,并将其作为开源工具提供给其他可能面临同样困境的开发者。


令人沮丧的经历

商业工具

最初的搜索结果指向了Aspose.Cells、Syncfusion等付费解决方案。虽然它们功能强大,但许可证费用高昂,对于小型或个人项目来说成本过高。

在线服务

免费的在线转换器似乎是一个不错的选择,但它们不适合自动化。这些工具通常存在隐私问题(因为文件上传到第三方服务器)、文件大小限制,并且不提供编程API。

开源库

我还探索了开源库,但大多数库缺乏将Excel文件转换为PDF的功能。即使是那些具备此功能的库,也往往不可靠或不支持现代Microsoft Office格式


无头模式下的LibreOffice

经过几周的搜索,我偶然发现了使用无头模式下的LibreOffice 的方法。LibreOffice是一个免费的开源办公套件,可以将多种文件格式(包括Excel)转换为PDF。在无头模式下运行时,它通过命令行操作,非常适合自动化。


我的解决方案的工作原理

为了方便开发者使用,我构建了一个轻量级的基于Go的HTTP服务器,充当REST API。该服务器封装了LibreOffice的功能,并允许任何编程语言通过HTTP请求与之交互。

主要功能

  1. 支持多种文件格式: 支持.xlsx、.xls、.csv、.docx、.pptx等多种格式。
  2. 自动清理: 临时文件在一小时后自动删除,以节省磁盘空间。
  3. 自定义字体: 可以通过克隆GitHub仓库或使用Docker卷来安装自定义字体。
  4. 跨语言集成: 可与任何支持HTTP的编程语言一起使用。

临时目录方法

我没有依赖系统的临时目录,而是选择使用自定义的./tmp目录。这确保了行为的一致性,因为系统临时目录有时权限不可预测。


实现细节

工作流程

  1. 文件上传: 客户端通过POST请求,使用/convert端点上传Excel文件。
  2. 临时存储: 服务器将文件保存到./tmp目录中,文件名基于时间戳。
  3. 转换: 在无头模式下调用LibreOffice将文件转换为PDF,并将结果保存到同一目录中。
  4. 文件清理: 后台goroutine删除超过一小时的文件。
  5. 响应: 将转换后的PDF作为HTTP响应返回。

入门指南

GitHub仓库

您可以在https://www.php.cn/link/5b1add8961a1cfa07e60838ffd0f83e7找到源代码。

Docker镜像

该项目也提供Docker镜像:wteja/pdf-converter

运行Docker容器

<code>docker pull wteja/pdf-converter
docker run -p 5000:5000 wteja/pdf-converter</code>

与其他语言集成的示例

由于服务通过HTTP公开,您可以使用任何编程语言与之交互。

C#

var client = new HttpClient();
var fileContent = new ByteArrayContent(File.ReadAllBytes("example.xlsx"));
var formData = new MultipartFormDataContent { { fileContent, "file", "example.xlsx" } };

var response = await client.PostAsync("http://localhost:5000/convert", formData);
var pdfBytes = await response.Content.ReadAsByteArrayAsync();
File.WriteAllBytes("output.pdf", pdfBytes);

Node.js

const axios = require("axios");
const FormData = require("form-data");
const fs = require("fs");

const form = new FormData();
form.append("file", fs.createReadStream("example.xlsx"));

axios.post("http://localhost:5000/convert", form, { headers: form.getHeaders() })
  .then(response => fs.writeFileSync("output.pdf", response.data))
  .catch(console.error);

Python

import requests

with open("example.xlsx", "rb") as f:
    response = requests.post("http://localhost:5000/convert", files={"file": f})

with open("output.pdf", "wb") as f:
    f.write(response.content)

Go

package main

import (
    "bytes"
    "io"
    "mime/multipart"
    "net/http"
    "os"
)

func main() {
    file, _ := os.Open("example.xlsx")
    defer file.Close()

    body := &bytes.Buffer{}
    writer := multipart.NewWriter(body)
    part, _ := writer.CreateFormFile("file", "example.xlsx")
    io.Copy(part, file)
    writer.Close()

    req, _ := http.NewRequest("POST", "http://localhost:5000/convert", body)
    req.Header.Set("Content-Type", writer.FormDataContentType())

    resp, _ := http.DefaultClient.Do(req)
    defer resp.Body.Close()

    out, _ := os.Create("output.pdf")
    defer out.Close()
    io.Copy(out, resp.Body)
}

挑战与权衡

镜像大小

由于LibreOffice的依赖项,Docker镜像大小为2.67 GB。虽然我测试了Alpine等更小的镜像,但它们包含的是旧版本的LibreOffice,与现代Microsoft Office格式不兼容。Debian虽然提供了最新的LibreOffice,但生成的镜像更大(约3 GB)。

为什么值得

与商业解决方案的成本相比,较大的镜像大小是可以接受的权衡。设置完成后,该镜像可以在多个项目中重复使用,无需支付额外的许可证费用。


结论

寻找免费的Excel转PDF转换器的挫折感促使我使用无头模式下的LibreOffice构建了自己的解决方案。虽然它并非完美无缺,但它是免费的、可靠的且灵活的。如果您面临同样的挑战,我希望这个项目能够为您节省时间和精力。

请在GitHub上查看该项目,或从Docker Hub拉取Docker镜像。请告诉我它对您的效果如何,或者您是否有改进建议。

以上是寻找免费的 Excel 到 PDF 转换器的斗争:我的旅程和解决方案的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
测试代码依赖于INET功能的代码测试代码依赖于INET功能的代码May 03, 2025 am 12:20 AM

whentestinggocodewithinitfunctions,useexplicitseTupfunctionsorseParateTestFileSteSteTepteTementDippedDependendendencyOnInItfunctionsIdeFunctionSideFunctionsEffect.1)useexplicitsetupfunctionStocontrolglobalvaribalization.2)createSepEpontrolglobalvarialization

将GO的错误处理方法与其他语言进行比较将GO的错误处理方法与其他语言进行比较May 03, 2025 am 12:20 AM

go'serrorhandlingurturnserrorsasvalues,与Javaandpythonwhichuseexceptions.1)go'smethodensursexplitirorhanderling,propertingrobustcodebutincreasingverbosity.2)

设计有效界面的最佳实践设计有效界面的最佳实践May 03, 2025 am 12:18 AM

AnefactiveInterfaceoisminimal,clear and promotesloosecoupling.1)minimizeTheInterfaceForflexibility andeaseofimplementation.2)useInterInterfaceForeabStractionTosWapImplementations withCallingCallingCode.3)

集中式错误处理策略集中式错误处理策略May 03, 2025 am 12:17 AM

集中式错误处理在Go语言中可以提升代码的可读性和可维护性。其实现方式和优势包括:1.将错误处理逻辑从业务逻辑中分离,简化代码。2.通过集中处理错误,确保错误处理的一致性。3.使用defer和recover来捕获和处理panic,增强程序健壮性。

init in Init函数的替代方案,用于go中的包装初始化init in Init函数的替代方案,用于go中的包装初始化May 03, 2025 am 12:17 AM

Ingo,替代词Inivuntionsionializatializatializationfunctionsandsingletons.1)customInitializationfunctions hallowexpliticpliticpliticconconconconconconconconconconconconconconconconconconconconconconconconconconconconconconconconconconconconconconconcontirization curssementializatizatupsetups.2)单次固定元素限制ininconinconcurrent

与GO接口键入断言和类型开关与GO接口键入断言和类型开关May 02, 2025 am 12:20 AM

Gohandlesinterfacesandtypeassertionseffectively,enhancingcodeflexibilityandrobustness.1)Typeassertionsallowruntimetypechecking,asseenwiththeShapeinterfaceandCircletype.2)Typeswitcheshandlemultipletypesefficiently,usefulforvariousshapesimplementingthe

使用errors.is和错误。使用errors.is和错误。May 02, 2025 am 12:11 AM

Go语言的错误处理通过errors.Is和errors.As函数变得更加灵活和可读。1.errors.Is用于检查错误是否与指定错误相同,适用于错误链的处理。2.errors.As不仅能检查错误类型,还能将错误转换为具体类型,方便提取错误信息。使用这些函数可以简化错误处理逻辑,但需注意错误链的正确传递和避免过度依赖以防代码复杂化。

在GO中进行性能调整:优化您的应用程序在GO中进行性能调整:优化您的应用程序May 02, 2025 am 12:06 AM

tomakegoapplicationsRunfasterandMorefly,useProflingTools,leverageConCurrency,andManageMoryfectily.1)usepprofforcpuorforcpuandmemoryproflingtoidentifybottlenecks.2)upitizegorizegoroutizegoroutinesandchannelstoparalletaparelalyizetasksandimproverperformance.3)

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

mPDF

mPDF

mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中

Dreamweaver Mac版

Dreamweaver Mac版

视觉化网页开发工具

SecLists

SecLists

SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合,这些列表在安全评估过程中经常使用,都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表,帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上,他就可以访问到所需的每种类型的列表。

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)