如何管理生成式AI-人工智能-PHP中文网

首页

科技周边

人工智能

如何管理生成式AI

王林

Mar 11, 2024 pm 12:04 PM

ai数据生成式敏感数据

如何管理生成式AI

作者丨Dom Couldwell

编译丨诺亚

出品 | 51CTO技术栈（微信号：blog51cto）

据麦肯锡公司估计，生成式人工智能预计每年将为全球经济带来2.6万亿至4.4万亿美元的经济效益。这一预测是建立在63个新的应用场景之上的，这些场景有望在多个市场中为客户带来改进、效率提升和新产品。对于开发者和IT领导者而言，这无疑是一个巨大的机遇。

生成式AI的核心在于数据。数据不仅赋予了生成式AI理解和分析周围世界的能力，也为其变革性的潜能提供了动力。在生成式AI领域取得成功，公司需要有效地管理和准备数据。

为成功构建和运营大规模的AI服务，以及支持生成式AI项目，你需要确保在数据准备方面做足功课，并采取明智可持续的资金支持策略。缓慢的步伐和逐渐减弱的支持方式无法在人工智能领域取得优势。因此，除了扩大AI服务规模外，还要确保项目的资金来源稳定，以助长长期发展和持续创新。

如果我们不改进数据管理方式，或未能采取正确的方法来应对规模扩大和成本控制问题，那么生成式AI蕴含的巨大潜力将会被白白浪费掉。以下是一些关于我们如何改进数据管理方法以及如何长期支持生成式AI项目的思考。

1.数据从哪里来

数据以多种形态存在，每种形态的数据如果使用得当，都能提升生成式AI洞察的丰富性和质量。

第一种形式是结构化数据，它以规则有序且一致的方式组织起来，包括产品信息、客户人口统计资料或库存水平等项目。这类数据提供了有组织的事实基础，可以添加到生成式AI项目中以提高响应的质量。

此外，您可能还有外部数据源可以补充内部结构化数据源，例如天气报告、股票价格或交通流量等。这些数据能够为决策过程带来实时和真实世界的背景信息，将其融入项目可提供额外高质量数据，但可能没有必要自行生成这类数据。

另一种常见的数据集是衍生数据，涵盖了通过分析和建模场景创建的数据。此类深度见解可能包括客户意图报告、季节性销售预测或群体分析等。

最后一种常见数据形式是非结构化数据，与分析师习惯的常规报告或数据格式不同，这类数据包括图像、文档和音频文件等格式。这些数据捕捉到了人类沟通和表达的细微之处。生成式AI程序常常围绕图像或音频工作，它们是生成式AI模型的常见输入和输出。

2.要让生成式AI实现大规模应用

所有这些多样的数据集各自存在于自己的环境中。为了使其对生成式AI项目有用，关键在于使这一多样化的数据景观在实时情况下可供访问。由于涉及如此大量的潜在数据，任何方法都必须能够在需求增长时动态扩展，并在全球范围内复制数据，确保资源在接到请求时能靠近用户，从而避免停机时间并减少交易请求中的延迟。

此外，还需要对这些数据进行预处理，以便生成式AI系统能够有效利用。这涉及到创建嵌入（embeddings），即代表语义含义的数学值，即向量。嵌入使得生成式AI系统能够超越特定文本匹配，而是涵盖数据内含的意义和上下文。无论原始数据形式如何，创建嵌入意味着数据能够被生成式AI系统理解并使用，同时保留其意义和上下文。

通过这些嵌入，企业可以支持跨所有数据的向量搜索或混合搜索，同时结合价值和意义。然后将这些结果收集起来传递回用于整合结果的大规模语言模型（LLM）。通过从多个源头提供更多数据，而不是仅仅依赖LLM本身，你的生成式AI项目就能为用户提供更准确的结果，并降低虚构内容的风险。

为了在实践中实现这一点，必须选择正确的底层数据架构。在这个过程中，应尽可能避免数据分散在不同解决方案中形成碎片化拼凑，因为每一个这样的解决方案都代表着一个需要长期支持、查询和管理的数据孤岛。用户应该能够快速向LLM提问并迅速得到回应，而不是等待多个组件响应并由模型权衡其结果。统一的数据架构应当提供无缝的数据集成，使生成式AI能够充分利用所有可用的数据频谱。

3.模块化方法的优势

为了扩展生成式AI实施，需要在加快采用速度与保持对关键资产的控制之间取得平衡。采用模块化的方式来构建生成式AI代理可以使这个过程变得更容易，因为它可以分解实施过程，避免潜在的瓶颈。

类似于微服务设计在应用程序中的应用，AI服务的模块化方法也鼓励围绕应用程序和软件设计的最佳实践，消除故障点，并让更多潜在用户能够接触这项技术。这种方法还使得监控整个企业中AI代理的表现变得更容易，能够更精确地找出问题发生的位置。

模块化的第一个好处是可解释性，因为参与生成式AI系统的各组成部分彼此分离，这样就更容易分析代理是如何运作和作出决策的。AI通常被视为“黑箱”，而模块化使得跟踪和解释结果变得更加容易。

第二个好处是安全性，因为各个组件可以通过最佳认证和授权机制进行保护，确保只有授权用户才能访问敏感数据和功能。模块化还使得合规和治理变得更容易，因为个人身份识别信息（PII）或知识产权（IP）可以得到保障，与底层LLM保持分离。

4.提供持续灵活的资金模型

除了采用微服务方法之外，还应在整体生成式AI项目中采用平台思维模式。这意味着取代传统的基于项目的软件项目资金模型，转而提供一种持续和灵活的资金模型。这种方法赋予参与者基于价值做决策的能力，能够响应新兴机会，并发展最佳实践，而不受制于僵硬的资金周期或商业案例。

以这种方式管理预算还能鼓励开发人员和业务团队将生成式AI视为组织已有的基础设施的一部分，从而更容易平滑规划工作负载的高峰和低谷，更容易采取“卓越中心”的方法并在长期内保持一致性。

类似的做法是将生成式AI视为企业自身运营的产品，而非单纯的软件。AI代理应作为产品来管理，因为这更能有效地体现其所创造的价值，并使整合、工具和提示方面的支持资源更容易获得。简化这种模式有助于在整个组织内普及对生成式AI的理解，促进最佳实践的采纳，并营造出共享专业知识和协作的生成式AI开发文化。

生成式AI具有巨大的潜力，各公司正竞相在其运营中实施新的工具、代理和提示。然而，要将这些潜在项目投入生产，就需要有效管理数据、奠定系统规模化发展的基础，并建立合适的预算模型以支持团队。合理安排流程和优先级将有助于你和你的团队释放这项技术的变革潜力。

参考地址：https://www.infoworld.com/article/3713461/how-to-manage-generative-ai.html

以上是如何管理生成式AI的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文转载于：51CTO.COM。如有侵权，请联系admin@php.cn删除

AI内部部署的隐藏危险：治理差距和灾难性风险Apr 28, 2025 am 11:12 AM

Apollo Research的一份新报告显示，先进的AI系统的不受检查的内部部署构成了重大风险。在大型人工智能公司中缺乏监督，普遍存在，允许潜在的灾难性结果

构建AI测谎仪Apr 28, 2025 am 11:11 AM

传统测谎仪已经过时了。依靠腕带连接的指针，打印出受试者生命体征和身体反应的测谎仪，在识破谎言方面并不精确。这就是为什么测谎结果通常不被法庭采纳的原因，尽管它曾导致许多无辜者入狱。相比之下，人工智能是一个强大的数据引擎，其工作原理是全方位观察。这意味着科学家可以通过多种途径将人工智能应用于寻求真相的应用中。一种方法是像测谎仪一样分析被审问者的生命体征反应，但采用更详细、更精确的比较分析。另一种方法是利用语言标记来分析人们实际所说的话，并运用逻辑和推理。俗话说，一个谎言会滋生另一个谎言，最终

AI是否已清除航空航天行业的起飞？Apr 28, 2025 am 11:10 AM

航空航天业是创新的先驱，它利用AI应对其最复杂的挑战。现代航空的越来越复杂性需要AI的自动化和实时智能功能，以提高安全性，降低操作

观看北京的春季机器人比赛Apr 28, 2025 am 11:09 AM

机器人技术的飞速发展为我们带来了一个引人入胜的案例研究。来自Noetix的N2机器人重达40多磅，身高3英尺，据说可以后空翻。Unitree公司推出的G1机器人重量约为N2的两倍，身高约4英尺。比赛中还有许多体型更小的类人机器人参赛，甚至还有一款由风扇驱动前进的机器人。数据解读这场半程马拉松吸引了超过12,000名观众，但只有21台类人机器人参赛。尽管政府指出参赛机器人赛前进行了“强化训练”，但并非所有机器人均完成了全程比赛。冠军——由北京类人机器人创新中心研发的Tiangong Ult

镜子陷阱：人工智能伦理和人类想象力的崩溃Apr 28, 2025 am 11:08 AM

人工智能以目前的形式并不是真正智能的。它擅长模仿和完善现有数据。我们不是在创造人工智能，而是人工推断 - 处理信息的机器，而人类则

新的Google泄漏揭示了方便的Google照片功能更新Apr 28, 2025 am 11:07 AM

一份报告发现，在谷歌相册Android版7.26版本的代码中隐藏了一个更新的界面，每次查看照片时，都会在屏幕底部显示一行新检测到的面孔缩略图。新的面部缩略图缺少姓名标签，所以我怀疑您需要单独点击它们才能查看有关每个检测到的人员的更多信息。就目前而言，此功能除了谷歌相册已在您的图像中找到这些人之外，不提供任何其他信息。此功能尚未上线，因此我们不知道谷歌将如何准确地使用它。谷歌可以使用缩略图来加快查找所选人员的更多照片的速度，或者可能用于其他目的，例如选择要编辑的个人。我们拭目以待。就目前而言