项目地址:https://github.com/ray-d-song/web-archive
我长期以来一直是 ArchiveBox 的忠实用户。 ArchiveBox是一个非常好的网络归档工具,但是它需要自托管,并且对服务器要求很高(需要无头浏览器)。我之前用过树莓派,性能不好
而像x、Medium这样需要登录的网站,ArchiveBox需要手动配置token或者cookie,比较麻烦。
于是我想,能不能有一个不需要自托管、不需要无头浏览器、对服务器没有要求、可以跨平台的网络归档工具呢?然后我就可以随时随地在任何设备上访问我的存档页面。
Cloudflare 的 Workers 服务非常强大且免费,拥有大量的 D1 数据库和 R2 存储桶,非常适合构建这个工具。
更重要的是,Cloudflare生态系统完整,支持一键部署和数据迁移。也可以使用Cloudflare的全球CDN服务。
网络存档由以下部分组成:
我使用SingleFile的开源代码将页面保存为单个html文件(甚至包括图像和视频)。
服务器完全基于Cloudflare的Workers服务,D1数据库用于存储元数据,R2存储桶用于存储快照。
虽然接口数量不小,但我并没有使用ORM,实际上我尝试过prisma和drizzle,因为它们给部署带来了很大的麻烦,所以最终没有使用。
Web客户端使用React、Vite、TailwindCSS和shadcn/ui构建,打包后的大小小得惊人,只有1.5MB。打包后的产品会嵌入到服务器的assets文件夹中,所以部署服务器时不需要单独部署。
我真的很喜欢 Cloudflare 的免费服务,但有一些限制。
这些限制在一定程度上影响了网站的建设,比如爬取时的ssr或者dom解析。
但是,无论怎么说,谢谢你,Cloudflare!
以上是我构建了一个在 Cloudflare 上运行的全栈 Web 存档工具的详细内容。更多信息请关注PHP中文网其他相关文章!