引言
近年来,人工智能领域取得了长足进步。随着人工智能的日益普及,开发者必须找到将AI集成到其应用程序中的方法。Gemini 通过 Node 的 GoogleGenerativeAI 包,为 JavaScript 开发者提供了一种便捷的 AI 开发途径。开发者可以访问由 Google DeepMind 开发的 Gemini 模型,从而利用 AI 创建令人兴奋的功能。Python 或 GO 用户可以使用其他软件包,Gemini 还提供 RESTful API。本文将讨论 Gemini 最新模型带来的改进,以及如何使用 Node 的 GoogleGenerativeAI 包入门。
主要进展
Gemini 1.5 Flash 模型的一项重大改进是能够处理单个请求中的上下文标记数量。过去,此类模型受到一次可以处理的文本或标记数量的限制。过去几年创建的生成模型一次只能处理 8000 个标记。虽然随着人工智能技术的进步,这个数字有所提高,但它仍然是一个限制因素。如今,Gemini 1.5 Flash 能够一次处理多达 100 万个标记。专业版(Gemini 1.5 Pro)可以处理多达 200 万个标记。这使得 Gemini 能够一次处理大量信息,同时保持非常高的准确率。您可以在此处阅读有关 Gemini 在人工智能领域取得的进展及其意义的更多信息。
入门
要使用 GoogleGenerativeAI 包,首先需要创建一个 Gemini API 密钥。这是一个快速简单的过程。
访问 API 密钥后,需要使用 Node 安装软件包。
npm install @google/generative-ai
完成所有这些操作后,您就可以开始使用 AI 进行开发了!
设置
将软件包导入您希望使用它的文件中。
<code class="language-javascript">import { GoogleGenerativeAI } from '@google/generative-ai'; // 或 const { GoogleGenerativeAI } = require('@google/generative-ai');</code>
创建一个 GoogleGenerativeAI 实例,同时传入您的 API 密钥。
<code class="language-javascript">const genAI = new GoogleGenerativeAI('YOUR_API_KEY');</code>
使用 getGenerativeModel 方法并传入您要使用的模型对象。有多个模型可用,此示例使用 Gemini 1.5 Flash 模型。Gemini 模型
<code class="language-javascript">const model = genAI.getGenerativeModel({ model: 'gemini-1.5-flash' });</code>
设置模型后,您可以使用 AI 生成文本、响应图像、从视频中提取信息等等。
配置和系统指令
您可以选择为模型提供配置和系统指令。配置应用于 generateContent 方法调用中的 generationConfig 属性。一些配置选项包括:
在此处查看更多 generationConfig 属性。提供系统指令可以通过为 AI 提供更多上下文来帮助改进响应。此外,模型将生成更多自定义响应,并能够更好地满足用户的需求。在初始化模型时提供系统指令。
<code class="language-javascript">import { GoogleGenerativeAI } from '@google/generative-ai'; // 或 const { GoogleGenerativeAI } = require('@google/generative-ai');</code>
文本生成
可以使用多种方法使用该软件包生成文本。最简单的方法是只为模型提供文本,但还有更多令人兴奋和复杂的方法可以生成文本。您可以为模型提供图像和文本,以便 AI 对图像做出反应。这是一个仅使用文本生成响应的请求的简单示例。模型设置未包含在此代码块中,但它仍然是代码的一部分。
<code class="language-javascript">const genAI = new GoogleGenerativeAI('YOUR_API_KEY');</code>
提示字符串被传递到模型的 generateContent 方法中。返回响应后,可以访问 response 属性的 text 方法中的响应。此响应的结果是:“月球表面覆盖着一层称为风化层的细尘,这是数十亿年微陨石撞击形成的。这种尘埃非常细,会粘在所有东西上,这对宇航员和月球设备构成挑战。”很酷吧?这是一个超级简单的例子,但还有更多可能性。
文本流和聊天
模型在返回响应之前等待生成整个响应文本。很明显吧?如果您不想等待生成整个响应,您可以使用文本流来通过不等待整个结果来获得更快的响应。这可以使用 streamGenerateContent 方法实现。以下是 Gemini API 文档中的一个示例。
<code class="language-javascript">const model = genAI.getGenerativeModel({ model: 'gemini-1.5-flash' });</code>
该软件包还提供跟踪对话的功能。“允许用户逐步找到答案”,这有助于用户解决多步骤问题。这是 Gemini API 的一个相对高级的功能。有关创建聊天和其他文本生成功能的更多信息,请阅读 Gemini API 文档。
结论
GoogleGenerativeAi 包使 JavaScript 开发者可以轻松地将其应用程序集成到 AI 技术中。该软件包在 AI 生成方面具有多种功能,包括文本、视频和图像。Gemini 能够一次处理大量文本的能力是 AI 生成的一项重大发展。借助 Node 的 GoogleGenerativeAI,开发者能够以更简单的方式在其项目中包含先进的 AI 技术。
来源
NPM DeepMind Gemini 长上下文
以上是Nodes GoogleGenerativeAI:将 AI 技术融入 javaScript的详细内容。更多信息请关注PHP中文网其他相关文章!