云端部署大模型的三个秘密-人工智能-PHP中文网

首页

科技周边

人工智能

云端部署大模型的三个秘密

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 24, 2024 pm 03:00 PM

语言模型云端llms安全传输

云端部署大模型的三个秘密

编译 | 星璇

出品 | 51CTO技术栈（微信号：blog51cto）

在过去的两年里，我更多地参与了使用大型语言模型（LLMs）的生成AI项目，而非传统的系统。我开始怀念无服务器云计算。它们的应用范围广泛，从增强对话AI到为各行各业提供复杂的分析解决方案，以及其他许多功能。许多企业将这些模型部署在云平台上，因为公共云提供商已经提供了现成的生态系统，而且这是阻力最小的路径。然而，这并不便宜。

云还提供了其他好处，如可扩展性、效率和高级计算能力（按需提供GPU）。在公共云平台上部署LLM的过程有一些鲜为人知的秘密，它们可能会对成功或失败产生重大影响。也许是因为处理LLMs的AI专家并不多，也因为我们在这方面还没太多经验，我们的知识体系中存在很多空白。

让我们探讨三个在云上部署LLM时鲜为人知的“技巧”，也许你的AI工程师们也不知道。考虑到这些工程师的年薪往往超过30万美元，也许现在是时候考虑他们做这些事情的细节了。我看到每个人都像头发发着火一样奔向生成为AI，但犯的错误比以往任何时候都多。

1.管理成本效益和可扩展性

云平台部署LLMs的主要吸引力之一是能够够按需扩展资源。我们不需要成为优秀的容量规划师，因为云平台拥有我们只需要点击鼠标或自动分配的资源。

然而，等待，我们即将犯下当初使用云计算时犯下的同样错误。在扩展的同时管理成本是一项技能，许多人需要在这方面获得帮助以进行有效导航。请注意，云服务通常根据消耗的计算资源收费；他们就像公共事业一样运作。处理得越多，付费就越多。考虑到GPU的成本更高（且耗电量更大），这是使用公共云提供商提供的LLMs时的核心关注点。

请确保您使用成本管理工具，包括云平台提供的工具和可靠的第三方成本治理和监控服务商（finops）提供的工具。例如，实施自动扩展和调度、选择合适的实例类型或使用抢占式实例来优化成本。此外，请记得持续监控部署情况，根据使用情况而不是仅根据预测负载调整资源。这意味着不惜一切代价避免过度配置（明白我这里的双关了吗？）。

2.多租户环境中的数据隐私

部署LLMs通常涉及处理大量数据和训练经过的知识模型，这些可能包含敏感或专有数据。使用公共云的风险在于，你的“邻居”是以处理实例的形式存在，它们在同一物理硬件上运行。因此，公共云确实存储在这样的风险：在数据存储和处理过程中，数据可能会被公共云数据中心中同一物理硬件上运行的其他虚拟机访问。为了解决这个问题，许多公共云提供商提供了面向企业的云安全选项。这些选项提供了物理硬件上运行的其他虚拟机访问你的数据的隔离和保护。另一个安全问题是数据在存储和处理过程中的传输。数据可能会通过公共云网络传输，这意味着在传输过程中可能会被截取或窃听。为了解决这个问题，公共云通常提供了加密和安全传输协议来保护数据在传输过程中的安全性。总的来说，部署LLMs

如果你询问公共云提供商有关此问题，他们会急忙拿出最新的PowerPoint演示文稿，展示这是不可能的。虽然这主要是真的，但并不完全准确。所有多租户系统都存在这种风险；你需要加以缓解。我发现，云提供商的规模越小，比如那些仅在单一国家运营的云提供商，这种问题出现的可能性就越大。这适用于数据存储和LLMs。

秘诀在于选择符合严格安全标准并能提供证明的云提供商：静止和传输中的数据加密、身份和访问管理（IAM）以及隔离策略。当然，更好的做法是你实施自己的安全策略和安全技术栈，以确保在云上使用多租户LLMs的风险较低。