搜索
首页后端开发Python教程只需几步即可将拥抱脸部模型部署到 AWS Lambda

是否曾经想将 Hugging Face 模型部署到 AWS Lambda,但却被容器构建、冷启动和模型缓存所困扰?以下是如何使用 Scaffoldly 在 5 分钟内完成此操作。

长话短说

  1. 在 AWS 中创建名为 .cache 的 EFS 文件系统:

    • 转到 AWS EFS 控制台
    • 点击“创建文件系统”
    • 将其命名为.cache
    • 选择任意 VPC(Scaffoldly 会处理剩下的事情!)
  2. 从 python-huggingface 分支创建您的应用程序:

     npx scaffoldly create app --template python-huggingface
    
  3. 部署它:

     cd my-app && npx scaffoldly deploy
    

就是这样!您将获得在 Lambda 上运行的 Hugging Face 模型(以 openai-community/gpt2 为例),并配有适当的缓存和容器部署。

专业提示:对于 EFS 设置,您可以将其自定义为突发模式下的单个 AZ,以进一步节省成本。 Scaffoldly 会将 Lambda 函数与 EFS 的 VPC、子网和安全组进行匹配。

✨ 查看现场演示和示例代码!

问题

将机器学习模型部署到 AWS Lambda 传统上涉及:

  • 构建和管理 Docker 容器
  • 弄清楚模型缓存和存储
  • 处理 Lambda 的大小限制
  • 管理冷启动
  • 设置 API 端点

当您只想为模型提供服务时,需要进行大量基础设施工作!

解决方案

Scaffoldly 通过一个简单的配置文件来处理所有这些复杂性。这是一个提供 Hugging Face 模型的完整应用程序(以 openai-community/gpt2 为例):

# app.py
from flask import Flask
from transformers import pipeline
app = Flask(__name__)
generator = pipeline('text-generation', model='openai-community/gpt2')
@app.route("/")
def hello_world():
    output = generator("Hello, world,")
    return output[0]['generated_text']
// requirements.txt
Flask ~= 3.0
gunicorn ~= 23.0
torch ~= 2.5
numpy ~= 2.1
transformers ~= 4.46
huggingface_hub[cli] ~= 0.26
// scaffoldly.json
{
  "name": "python-huggingface",
  "runtime": "python:3.12",
  "handler": "localhost:8000",
  "files": ["app.py"],
  "packages": ["pip:requirements.txt"],
  "resources": ["arn::elasticfilesystem:::file-system/.cache"],
  "schedules": {
    "@immediately": "huggingface-cli download openai-community/gpt2"
  },
  "scripts": {
    "start": "gunicorn app:app"
  },
  "memorySize": 1024
}

它是如何运作的

Scaffoldly 在幕后做了一些聪明的事情:

  1. 智能集装箱建筑

    • 自动创建针对 Lambda 优化的 Docker 容器
    • 处理所有 Python 依赖项,包括 PyTorch
    • 无需编写任何 Docker 命令即可推送到 ECR
  2. 高效的模型处理:

    • 使用 Amazon EFS 缓存模型文件
    • 部署后预下载模型以加快冷启动
    • 在 Lambda 中自动挂载缓存
  3. Lambda 就绪设置:

    • Rus 建立一个合适的 WSGI 服务器(gunicorn)
    • 创建公共 Lambda 函数 URL
    • 代理函数 URL 请求gunicorn
    • 管理 IAM 角色和权限

部署是什么样的

这是我在此示例中运行的 npx 脚手架部署命令的输出:

Deploy Hugging Face Models to AWS Lambda in teps

现实世界的性能和成本

成本:AWS Lambda、ECR 和 EFS 约 0.20 美元/天

冷启动:第一次请求约 20 秒(模型加载)

热烈请求:5-20秒(基于CPU的推理)

虽然此设置使用 CPU 推理(比 GPU 慢),但这是一种试验 ML 模型或服务低流量端点的极其经济高效的方法。

其他型号定制

想要使用不同的模型吗?只需更新两个文件:

  1. 更改app.py中的模型:
 npx scaffoldly create app --template python-huggingface
  1. 更新scaffoldly.json中的下载:
 cd my-app && npx scaffoldly deploy

使用私有或门控模型

Scaffoldly 通过 HF_TOKEN 环境变量支持私有和门控模型。您可以通过多种方式添加 Hugging Face 令牌:

  • 本地开发:添加到您的 shell 配置文件(.bashrc、.zprofile 等):
# app.py
from flask import Flask
from transformers import pipeline
app = Flask(__name__)
generator = pipeline('text-generation', model='openai-community/gpt2')
@app.route("/")
def hello_world():
    output = generator("Hello, world,")
    return output[0]['generated_text']
  • CI/CD:添加为 GitHub Actions Secret:
// requirements.txt
Flask ~= 3.0
gunicorn ~= 23.0
torch ~= 2.5
numpy ~= 2.1
transformers ~= 4.46
huggingface_hub[cli] ~= 0.26

令牌将自动用于下载和访问您的私人或门控模型。

CI/CD 奖金

Scaffoldly 甚至生成用于自动部署的 GitHub Action:

// scaffoldly.json
{
  "name": "python-huggingface",
  "runtime": "python:3.12",
  "handler": "localhost:8000",
  "files": ["app.py"],
  "packages": ["pip:requirements.txt"],
  "resources": ["arn::elasticfilesystem:::file-system/.cache"],
  "schedules": {
    "@immediately": "huggingface-cli download openai-community/gpt2"
  },
  "scripts": {
    "start": "gunicorn app:app"
  },
  "memorySize": 1024
}

自己尝试一下

完整的示例可以在 GitHub 上找到:
脚手架/脚手架示例#python-huggingface

您可以通过运行以下命令创建您自己的示例副本:

generator = pipeline('text-generation', model='your-model-here')

您可以看到它正在实时运行(尽管由于 CPU 推断,响应可能会很慢):
现场演示

接下来是什么?

  • 尝试部署不同的拥抱脸模型
  • 加入 Discord 上的 Scaffoldly 社区
  • 查看其他示例
  • 如果您觉得这有用,请给我们的代码库加星标!
    • 脚手架工具链
    • Scaffoldly 示例存储库

许可证

Scaffoldly 是开源的,欢迎社区贡献。

  • 这些示例已获得 Apache-2.0 许可证的许可。
  • 脚手架工具链已获得 FSL-1.1-Apache-2.0 许可证。

您还想在 AWS Lambda 中运行哪些其他模型?请在评论中告诉我!

以上是只需几步即可将拥抱脸部模型部署到 AWS Lambda的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
如何使用Python查找文本文件的ZIPF分布如何使用Python查找文本文件的ZIPF分布Mar 05, 2025 am 09:58 AM

本教程演示如何使用Python处理Zipf定律这一统计概念,并展示Python在处理该定律时读取和排序大型文本文件的效率。 您可能想知道Zipf分布这个术语是什么意思。要理解这个术语,我们首先需要定义Zipf定律。别担心,我会尽量简化说明。 Zipf定律 Zipf定律简单来说就是:在一个大型自然语言语料库中,最频繁出现的词的出现频率大约是第二频繁词的两倍,是第三频繁词的三倍,是第四频繁词的四倍,以此类推。 让我们来看一个例子。如果您查看美国英语的Brown语料库,您会注意到最频繁出现的词是“th

我如何使用美丽的汤来解析HTML?我如何使用美丽的汤来解析HTML?Mar 10, 2025 pm 06:54 PM

本文解释了如何使用美丽的汤库来解析html。 它详细介绍了常见方法,例如find(),find_all(),select()和get_text(),以用于数据提取,处理不同的HTML结构和错误以及替代方案(SEL)

python中的图像过滤python中的图像过滤Mar 03, 2025 am 09:44 AM

处理嘈杂的图像是一个常见的问题,尤其是手机或低分辨率摄像头照片。 本教程使用OpenCV探索Python中的图像过滤技术来解决此问题。 图像过滤:功能强大的工具 图像过滤器

如何使用TensorFlow或Pytorch进行深度学习?如何使用TensorFlow或Pytorch进行深度学习?Mar 10, 2025 pm 06:52 PM

本文比较了Tensorflow和Pytorch的深度学习。 它详细介绍了所涉及的步骤:数据准备,模型构建,培训,评估和部署。 框架之间的关键差异,特别是关于计算刻度的

Python中的平行和并发编程简介Python中的平行和并发编程简介Mar 03, 2025 am 10:32 AM

Python是数据科学和处理的最爱,为高性能计算提供了丰富的生态系统。但是,Python中的并行编程提出了独特的挑战。本教程探讨了这些挑战,重点是全球解释

如何在Python中实现自己的数据结构如何在Python中实现自己的数据结构Mar 03, 2025 am 09:28 AM

本教程演示了在Python 3中创建自定义管道数据结构,利用类和操作员超载以增强功能。 管道的灵活性在于它能够将一系列函数应用于数据集的能力,GE

python对象的序列化和避难所化:第1部分python对象的序列化和避难所化:第1部分Mar 08, 2025 am 09:39 AM

Python 对象的序列化和反序列化是任何非平凡程序的关键方面。如果您将某些内容保存到 Python 文件中,如果您读取配置文件,或者如果您响应 HTTP 请求,您都会进行对象序列化和反序列化。 从某种意义上说,序列化和反序列化是世界上最无聊的事情。谁会在乎所有这些格式和协议?您想持久化或流式传输一些 Python 对象,并在以后完整地取回它们。 这是一种在概念层面上看待世界的好方法。但是,在实际层面上,您选择的序列化方案、格式或协议可能会决定程序运行的速度、安全性、维护状态的自由度以及与其他系

Python中的数学模块:统计Python中的数学模块:统计Mar 09, 2025 am 11:40 AM

Python的statistics模块提供强大的数据统计分析功能,帮助我们快速理解数据整体特征,例如生物统计学和商业分析等领域。无需逐个查看数据点,只需查看均值或方差等统计量,即可发现原始数据中可能被忽略的趋势和特征,并更轻松、有效地比较大型数据集。 本教程将介绍如何计算平均值和衡量数据集的离散程度。除非另有说明,本模块中的所有函数都支持使用mean()函数计算平均值,而非简单的求和平均。 也可使用浮点数。 import random import statistics from fracti

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
2 周前By尊渡假赌尊渡假赌尊渡假赌
仓库:如何复兴队友
4 周前By尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island冒险:如何获得巨型种子
4 周前By尊渡假赌尊渡假赌尊渡假赌

热工具

PhpStorm Mac 版本

PhpStorm Mac 版本

最新(2018.2.1 )专业的PHP集成开发工具

安全考试浏览器

安全考试浏览器

Safe Exam Browser是一个安全的浏览器环境,用于安全地进行在线考试。该软件将任何计算机变成一个安全的工作站。它控制对任何实用工具的访问,并防止学生使用未经授权的资源。

SublimeText3 英文版

SublimeText3 英文版

推荐:为Win版本,支持代码提示!

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)