Gemini 1.5 Pro API教程：开始使用Google的LLM-人工智能-PHP中文网

首页

科技周边

人工智能

Gemini 1.5 Pro API教程：开始使用Google的LLM

Joseph Gordon-Levitt

Mar 06, 2025 am 10:34 AM

gemini 1.5 Pro：深入研究Google的高级多模式AI及其API

Google的Gemini 1.5 Pro代表了AI的重大飞跃，在文本，视频和音频模式之间具有长篇文本的推理能力。该教程指导您连接并利用Gemini 1.5 Pro API来进行检索，问答和秘密学习等任务。要对双子座家族有更广泛的了解，请探索此资源：什么是Google Gemini

。双子座家族：一系列功能 Gemini AI家族由Google Research和Google DeepMind开发的几种生成AI模型。这些模型在各种多模式任务中表现出色，从而帮助开发人员进行内容创建和解决问题。每个模型变体都是针对特定应用程序量身定制的，可在各种情况下优化性能。家庭通过提供三个尺寸级别来平衡计算需求和功能：

本教程重点介绍Gemini 1.5 Pro，这是1.5系列中的首届模型。

gemini 1.5 Pro：前所未有的长篇小写理解

gemini 1.5 Pro的大量上下文窗口（至少1000万个令牌）使其能够理解各种应用程序的广泛背景。跨长依赖性任务进行严格的测试证明了其出色的功能。它在“针中的针刺”场景中达到了接近完美的召回（＆GT; 99％），即使大草原超过1000万个令牌也是如此。 Gemini 1.5 Pro优于竞争者，包括使用外部检索方法的竞争对手，尤其是在需要理解大量内容相互依赖的任务上。它执行秘密学习的能力，例如从单个语言文档中翻译新语言的能力，也非常出色。这种增强的长篇小说性能不会损害其固有的多模式能力。它在各个领域（数学，科学和推理的28.9％）在其前任（Gemini 1.0 Pro）方面有了显着改善，甚至超过了许多基准中的Gemini 1.0 Ultra Model。

数据源。 Gemini 1.5 Pro API Tutorial: Getting Started With Google's LLM 有关全面的详细信息，请参阅技术报告：“双子座1.5：在数百万个上下文中解锁多模式理解”。 Gemini 1.5 pro 的现实世界应用 gemini 1.5 Pro处理数百万个代币的能力为创新应用打开了门：

软件工程：它可以在大规模代码库中查明特定代码位置（例如，在746,152-token Jax Codebase中识别核心自动差异方法）。

）。

语言翻译：它可以在有限的在线数据的语言之间翻译，仅依赖于提供的上下文（例如，使用语法书籍和WordList从英语翻译为Kalamang）。这显示了保存濒危语言的希望。

>图像和视频分析：它可以在冗长的文本中识别场景（例如，根据草图找到一个场景
）和视频（例如。连接到双子座1.5 Pro API：逐步指南
>让我们探索如何通过其API访问双子座1.5 Pro的力量。 步骤1：获得API键

>导航到开发人员页面的Google AI（确保您登录）。单击“获取API键”生成一个。您需要设置一个项目。

Gemini 1.5 Pro API Tutorial: Getting Started With Google's LLM

>步骤2：设置您的python环境

安装必要的python软件包：

pip install google-generativeai

>导入您的jupyter笔记本中所需的库：

import google.generativeai as genai
from google.generativeai.types import ContentType
from PIL import Image
from IPython.display import Markdown
import time
import cv2

>步骤3：进行API调用

>用键配置API：

GOOGLE_API_KEY = 'your-api-key-goes-here'
genai.configure(api_key=GOOGLE_API_KEY)

检查可用模型：

for m in genai.list_models():
    if 'generateContent' in m.supported_generation_methods:
        print(m.name)

>访问Gemini 1.5 Pro：

model = genai.GenerativeModel('gemini-1.5-pro-latest')

做一个简单的文本提示：

response = model.generate_content("Please provide a list of the most influential people in the world.")
print(response.text)

Gemini 1.5 Pro API Tutorial: Getting Started With Google's LLM

双子AI提供了多个响应候选者；选择最好的一个。

Gemini 1.5 Pro API Tutorial: Getting Started With Google's LLM

>带有双子座的图像提示1.5 pro

>

>让我们演示图像处理。假设您有一个名为“ bookshelf.jpeg”的图像：

text_prompt = "List all the books and help me organize them into three categories."
bookshelf_image = Image.open('bookshelf.jpeg')
prompt = [text_prompt, bookshelf_image]
response = model.generate_content(prompt)
Markdown(response.text)

Gemini 1.5 Pro API Tutorial: Getting Started With Google's LLM

结论

> Gemini 1.5 Pro具有其扩展上下文窗口和多模式功能，为各种应用程序提供了强大的工具。它的API提供了使用不同数据类型的灵活性，使其成为开发人员的宝贵资产。为了促进您的AI知识，请考虑此技能轨道： ai基础知识技能

。。

以上是Gemini 1.5 Pro API教程：开始使用Google的LLM的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

AI游戏开发通过Upheaval的Dreamer Portal进入其代理时代May 02, 2025 am 11:17 AM

动荡游戏：与AI代理商的游戏开发彻底改变 Roupheaval是一家游戏开发工作室，由暴风雪和黑曜石等行业巨头的退伍军人组成，有望用其创新的AI驱动的Platfor革新游戏创作

Uber想成为您的Robotaxi商店，提供商会让他们吗？May 02, 2025 am 11:16 AM

Uber的Robotaxi策略：自动驾驶汽车的骑车生态系统在最近的Curbivore会议上，Uber的Richard Willder推出了他们成为Robotaxi提供商的乘车平台的策略。利用他们在

AI代理玩电子游戏将改变未来的机器人May 02, 2025 am 11:15 AM

事实证明，视频游戏是尖端AI研究的宝贵测试场所，尤其是在自主代理和现实世界机器人的开发中，甚至有可能促进人工通用智能（AGI）的追求。一个

创业公司工业综合体VC 3.0和James Currier的宣言May 02, 2025 am 11:14 AM

不断发展的风险投资格局的影响在媒体，财务报告和日常对话中显而易见。但是，对投资者，初创企业和资金的具体后果经常被忽略。风险资本3.0：范式

Adobe在Adobe Max London 2025更新创意云和萤火虫May 02, 2025 am 11:13 AM

Adobe Max London 2025对Creative Cloud和Firefly进行了重大更新，反映了向可访问性和生成AI的战略转变。该分析结合了事件前简报中的见解，并融合了Adobe Leadership。（注意：Adob

Llamacon宣布的所有元数据May 02, 2025 am 11:12 AM

Meta的Llamacon公告展示了一项综合的AI策略，旨在直接与OpenAI等封闭的AI系统竞争，同时为其开源模型创建了新的收入流。这个多方面的方法目标bo

关于AI仅仅是普通技术的主张的酿造争议May 02, 2025 am 11:10 AM

人工智能领域对这一论断存在严重分歧。一些人坚称，是时候揭露“皇帝的新衣”了，而另一些人则强烈反对人工智能仅仅是普通技术的观点。让我们来探讨一下。对这一创新性人工智能突破的分析，是我持续撰写的福布斯专栏文章的一部分，该专栏涵盖人工智能领域的最新进展，包括识别和解释各种有影响力的人工智能复杂性（请点击此处查看链接）。人工智能作为普通技术首先，需要一些基本知识来为这场重要的讨论奠定基础。目前有大量的研究致力于进一步发展人工智能。总目标是实现人工通用智能（AGI）甚至可能实现人工超级智能（AS