本文详细介绍了在 AWS 上部署可扩展且有状态的 Streamlit 应用程序,解决从本地开发迁移到生产云环境时面临的常见挑战。 重点是克服 Streamlit 默认内存状态管理的限制,该限制会导致页面刷新或服务器重新启动时数据丢失,尤其是在重负载下。
Streamlit 的可扩展性挑战: Streamlit 擅长快速 Web 应用程序开发,但其固有的内存状态管理不足以支持多用户、基于云的部署。 单纯增加VM资源是一种短视的解决方案,并不能解决数据持久化的核心问题。
建议的架构 (AWS): 提出的解决方案使用强大的架构来处理可扩展性和状态性:
- 应用程序负载均衡器 (ALB): 在多个实例之间均匀分配传入流量。
- Fargate 上的弹性容器服务 (ECS): 管理 Docker 容器,无需服务器管理开销即可轻松扩展。 利用arm64架构和优化的资源分配(0.25vCPU/0.5GB RAM)来提高成本效率。
- 弹性文件系统(EFS):提供可扩展且持久的文件系统,挂载到多个ECS节点。这确保了跨可用区 (AZ) 的数据冗余和持久性,解决了核心状态问题。
- CloudFront(可选):提高性能并通过 CDN 功能添加 HTTPS 安全性。
为什么不选择 AWS Lambda?: Lambda 虽然对无服务器计算很有吸引力,但由于 Streamlit 依赖于 websocket 二进制帧,而 Lambda 的 API 网关不支持,因此与 Streamlit 不兼容。
EFS 与其他选项: 比较表突出了 EFS 相对于 RDS、DynamoDB、ElasticCache 和 S3 等替代方案的优势,强调了其针对此特定选项的易于设置、可扩展性和成本效益用例。
解决负载均衡器成本:本文承认 ALB 的固有成本,但认为其好处(流量分配、HTTP/2 支持、AWS 集成)超过了费用,特别是考虑到可靠性和性能的提高用于生产应用程序。
解决方案:此解决方案的关键是结合使用浏览器端本地存储(通过 streamlit-local-storage
)来存储会话密钥,并使用 EFS 来存储持久会话数据。 这可以最大程度地减少内存状态,同时确保跨 ECS 节点和扩展事件的数据持久性。 这种方法的简单性得到了凸显——核心应用程序代码在本地开发和云部署之间基本保持不变。
项目模板和伪代码:提供了一个示例LLM聊天机器人项目(https://www.php.cn/link/f3a3cc4e1b8b4b0438505c0a38efad9f),以及说明会话数据如何处理的伪代码使用 pickle
进行序列化和 EFS 进行存储进行管理。 该代码演示了基于唯一会话 ID 检索和保存会话数据,即使不同的 ECS 任务处理同一会话也能确保一致性。
部署步骤:本文提供了部署应用程序的简明指南:克隆存储库、部署 CloudFormation 堆栈、构建和部署 Docker 映像、访问聊天机器人以及(隐式)启用自动缩放以实现最佳可扩展性。
结论: 这种方法为在 AWS 上部署可扩展且有状态的 Streamlit 应用程序提供了实用且高效的解决方案,使开发人员能够专注于应用程序逻辑而不是复杂的基础设施管理。该解决方案优先考虑简单性和成本效益,同时确保数据持久性和高可用性。
以上是使用 AWS ECS 和 EFS 扩展有状态 Streamlit 聊天机器人的详细内容。更多信息请关注PHP中文网其他相关文章!

本教程演示如何使用Python处理Zipf定律这一统计概念,并展示Python在处理该定律时读取和排序大型文本文件的效率。 您可能想知道Zipf分布这个术语是什么意思。要理解这个术语,我们首先需要定义Zipf定律。别担心,我会尽量简化说明。 Zipf定律 Zipf定律简单来说就是:在一个大型自然语言语料库中,最频繁出现的词的出现频率大约是第二频繁词的两倍,是第三频繁词的三倍,是第四频繁词的四倍,以此类推。 让我们来看一个例子。如果您查看美国英语的Brown语料库,您会注意到最频繁出现的词是“th

本文解释了如何使用美丽的汤库来解析html。 它详细介绍了常见方法,例如find(),find_all(),select()和get_text(),以用于数据提取,处理不同的HTML结构和错误以及替代方案(SEL)

处理嘈杂的图像是一个常见的问题,尤其是手机或低分辨率摄像头照片。 本教程使用OpenCV探索Python中的图像过滤技术来解决此问题。 图像过滤:功能强大的工具 图像过滤器

PDF 文件因其跨平台兼容性而广受欢迎,内容和布局在不同操作系统、阅读设备和软件上保持一致。然而,与 Python 处理纯文本文件不同,PDF 文件是二进制文件,结构更复杂,包含字体、颜色和图像等元素。 幸运的是,借助 Python 的外部模块,处理 PDF 文件并非难事。本文将使用 PyPDF2 模块演示如何打开 PDF 文件、打印页面和提取文本。关于 PDF 文件的创建和编辑,请参考我的另一篇教程。 准备工作 核心在于使用外部模块 PyPDF2。首先,使用 pip 安装它: pip 是 P

本教程演示了如何利用Redis缓存以提高Python应用程序的性能,特别是在Django框架内。 我们将介绍REDIS安装,Django配置和性能比较,以突出显示BENE

本文比较了Tensorflow和Pytorch的深度学习。 它详细介绍了所涉及的步骤:数据准备,模型构建,培训,评估和部署。 框架之间的关键差异,特别是关于计算刻度的

Python是数据科学和处理的最爱,为高性能计算提供了丰富的生态系统。但是,Python中的并行编程提出了独特的挑战。本教程探讨了这些挑战,重点是全球解释

本教程演示了在Python 3中创建自定义管道数据结构,利用类和操作员超载以增强功能。 管道的灵活性在于它能够将一系列函数应用于数据集的能力,GE


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

PhpStorm Mac 版本
最新(2018.2.1 )专业的PHP集成开发工具

Dreamweaver Mac版
视觉化网页开发工具

SecLists
SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合,这些列表在安全评估过程中经常使用,都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表,帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上,他就可以访问到所需的每种类型的列表。

DVWA
Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中

MinGW - 适用于 Windows 的极简 GNU
这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。