亚马逊云科技在2023年7月26日举办的纽约峰会上推出了七个生成式AI创新项目,这进一步降低了生成式AI的使用门槛,让企业能够更专注于核心业务,提高生产效率。其中一个引人注目的项目是亚马逊云科技即将推出的向量数据库相关创新,他们发布了亚马逊云科技向量引擎的预览版
近日,亚马逊云科技发布了Amazon OpenSearch Serverless向量引擎的预览版。这次发布标志着云搜索服务领域的重大进展,为用户提供了简单、高性能且可扩展的相似性搜索功能
在2023年2月,亚马逊云科技已经连续八年被Gartner评为云数据库管理系统的领导者,这样的荣誉并非偶然,而是对亚马逊云科技不懈追求技术创新和卓越的充分肯定。
那么,亚马逊云科技的向量引擎预览版的性能如何呢?是否能承担得起大众对它的期待呢?
我们都知道,现在这个时代,因为生成式AI能处理大数据、自动化内容生成及提供类人交互响应等,正在被各行业迅速采用。集成聊天机器人、问答系统和个性化推荐等AI应用利用自然语言搜索和查询,理解语义、用户意图,生成拟人响应,已经彻底变革用户体验和数字平台交互。
机器学习搜索和生成式AI应用需要使用向量嵌入来表示文本、图像、音频和视频的数字形式,以生成动态内容。这些嵌入是基于用户数据进行训练的,用来表达信息的语义和上下文。这个过程不需要依赖外部数据源或应用,用户希望向量数据库能够轻松构建,并能快速从原型进入生产环境,以便专注于差异化应用
Amazon OpenSearch Serverless向量引擎正是基于这些需求的变化而推出的,它扩展了Amazon OpenSearch的搜索功能,可以实时存储、搜索和追溯数十亿个向量嵌入,实现相似性匹配和语义搜索,无需考虑基础设施的问题
因此,它的性能大致能概括为以下几个特点:
重新写的内容是:首先,Amazon OpenSearch Serverless向量引擎试用版具备天然的鲁棒性。用户无需担心后端基础设施的选择、优化和扩展问题。该引擎能够自动调整资源,以适应不断变化的工作负载和需求,确保始终提供快速的性能和适当的规模。不论向量数量从数千增加到数亿,引擎都能够无缝扩展,无需重新索引或重新加载数据,使得基础设施的扩展更为便捷
重写后的内容:其二,独立的计算资源。向量引擎提供独立的计算资源,用于索引和工作负载搜索,实现实时无缝获取、更新和删除向量,保证用户查询性能不受影响。数据长期存储在Amazon S3中,并享有相同的数据持久性保证。虽然处于预览阶段,但该引擎专为生产环境设计,具备冗余机制以应对中断和故障
其三、提供的结果精准而可靠。客户在托管集群中使用OpenSearch kNN搜索,实现应用程序的语义搜索和个性化推荐。向量引擎提供与Serverless环境相同的用户体验,简单易用。亚马逊OpenSearch无服务向量引擎基于OpenSearch项目的k近邻(kNN)搜索功能,支持欧氏距离、余弦距离和点积等距离指标,可容纳16000个维度,适用于各种基础模型和AI/ML模型,可以为用户提供精准可靠的检索结果
亚马逊云科技计划推出两项功能,以降低客户的首个集合成本。除了以上提到的强大性能外,首先,他们将推出新的开发-测试选项,允许用户在没有备份或副本的情况下启动集合,从而降低50%的入门成本。数据持久性仍然通过保存在Amazon S3中的向量引擎来确保。其次,他们还将提供初始阶段配置0.5 OCU资源,根据实际工作负载的需求进行扩展,进一步降低成本。这项功能适用于数万至数十万个向量(具体取决于维度)。此外,亚马逊云科技还将最低所需的OCU从每小时4个降低到每小时1个,以提供更多支持
亚马逊云科技的野心肯定还不止于此,他们还在持续努力优化向量图的性能和内存使用,包括改进缓存和合并等功能
在不久的将来,我们期待亚马逊云科技正式推出OpenSearch Serverless向量引擎。届时,生成式AI可能会进入一个全新的领域
以上是亚马逊云科技向量数据库预览版开售,高性能助力AI应用加速的详细内容。更多信息请关注PHP中文网其他相关文章!