首页 >web前端 >js教程 >Node&#s GoogleGenerativeAI:将 AI 技术融入 javaScript

Node&#s GoogleGenerativeAI:将 AI 技术融入 javaScript

Patricia Arquette
Patricia Arquette原创
2025-01-27 02:41:12896浏览

Node

引言

近年来,人工智能领域取得了长足进步。随着人工智能的日益普及,开发者必须找到将AI集成到其应用程序中的方法。Gemini 通过 Node 的 GoogleGenerativeAI 包,为 JavaScript 开发者提供了一种便捷的 AI 开发途径。开发者可以访问由 Google DeepMind 开发的 Gemini 模型,从而利用 AI 创建令人兴奋的功能。Python 或 GO 用户可以使用其他软件包,Gemini 还提供 RESTful API。本文将讨论 Gemini 最新模型带来的改进,以及如何使用 Node 的 GoogleGenerativeAI 包入门。

主要进展

Gemini 1.5 Flash 模型的一项重大改进是能够处理单个请求中的上下文标记数量。过去,此类模型受到一次可以处理的文本或标记数量的限制。过去几年创建的生成模型一次只能处理 8000 个标记。虽然随着人工智能技术的进步,这个数字有所提高,但它仍然是一个限制因素。如今,Gemini 1.5 Flash 能够一次处理多达 100 万个标记。专业版(Gemini 1.5 Pro)可以处理多达 200 万个标记。这使得 Gemini 能够一次处理大量信息,同时保持非常高的准确率。您可以在此处阅读有关 Gemini 在人工智能领域取得的进展及其意义的更多信息。

入门

要使用 GoogleGenerativeAI 包,首先需要创建一个 Gemini API 密钥。这是一个快速简单的过程。

  1. 前往 Google AI Studio
  2. 点击左上角的“获取 API 密钥”按钮
  3. 点击“创建 API 密钥”按钮

访问 API 密钥后,需要使用 Node 安装软件包。 npm install @google/generative-ai 完成所有这些操作后,您就可以开始使用 AI 进行开发了!

设置

将软件包导入您希望使用它的文件中。

<code class="language-javascript">import { GoogleGenerativeAI } from '@google/generative-ai';
// 或
const { GoogleGenerativeAI } = require('@google/generative-ai');</code>

创建一个 GoogleGenerativeAI 实例,同时传入您的 API 密钥。

<code class="language-javascript">const genAI = new GoogleGenerativeAI('YOUR_API_KEY');</code>

使用 getGenerativeModel 方法并传入您要使用的模型对象。有多个模型可用,此示例使用 Gemini 1.5 Flash 模型。Gemini 模型

<code class="language-javascript">const model = genAI.getGenerativeModel({ model: 'gemini-1.5-flash' });</code>

设置模型后,您可以使用 AI 生成文本、响应图像、从视频中提取信息等等。

配置和系统指令

您可以选择为模型提供配置和系统指令。配置应用于 generateContent 方法调用中的 generationConfig 属性。一些配置选项包括:

  • responseSchema:生成的文本的输出模式
  • candidateCount:(整数)要返回的响应数量
  • temperature:(数字)控制输出的随机性

在此处查看更多 generationConfig 属性。提供系统指令可以通过为 AI 提供更多上下文来帮助改进响应。此外,模型将生成更多自定义响应,并能够更好地满足用户的需求。在初始化模型时提供系统指令。

<code class="language-javascript">import { GoogleGenerativeAI } from '@google/generative-ai';
// 或
const { GoogleGenerativeAI } = require('@google/generative-ai');</code>

文本生成

可以使用多种方法使用该软件包生成文本。最简单的方法是只为模型提供文本,但还有更多令人兴奋和复杂的方法可以生成文本。您可以为模型提供图像和文本,以便 AI 对图像做出反应。这是一个仅使用文本生成响应的请求的简单示例。模型设置未包含在此代码块中,但它仍然是代码的一部分。

<code class="language-javascript">const genAI = new GoogleGenerativeAI('YOUR_API_KEY');</code>

提示字符串被传递到模型的 generateContent 方法中。返回响应后,可以访问 response 属性的 text 方法中的响应。此响应的结果是:“月球表面覆盖着一层称为风化层的细尘,这是数十亿年微陨石撞击形成的。这种尘埃非常细,会粘在所有东西上,这对宇航员和月球设备构成挑战。”很酷吧?这是一个超级简单的例子,但还有更多可能性。

文本流和聊天

模型在返回响应之前等待生成整个响应文本。很明显吧?如果您不想等待生成整个响应,您可以使用文本流来通过不等待整个结果来获得更快的响应。这可以使用 streamGenerateContent 方法实现。以下是 Gemini API 文档中的一个示例。

<code class="language-javascript">const model = genAI.getGenerativeModel({ model: 'gemini-1.5-flash' });</code>

该软件包还提供跟踪对话的功能。“允许用户逐步找到答案”,这有助于用户解决多步骤问题。这是 Gemini API 的一个相对高级的功能。有关创建聊天和其他文本生成功能的更多信息,请阅读 Gemini API 文档。

结论

GoogleGenerativeAi 包使 JavaScript 开发者可以轻松地将其应用程序集成到 AI 技术中。该软件包在 AI 生成方面具有多种功能,包括文本、视频和图像。Gemini 能够一次处理大量文本的能力是 AI 生成的一项重大发展。借助 Node 的 GoogleGenerativeAI,开发者能够以更简单的方式在其项目中包含先进的 AI 技术。

来源

NPM DeepMind Gemini 长上下文

以上是Node&#s GoogleGenerativeAI:将 AI 技术融入 javaScript的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn