首页 >科技周边 >人工智能 >Gemini 1.5 Pro API教程:开始使用Google的LLM

Gemini 1.5 Pro API教程:开始使用Google的LLM

Joseph Gordon-Levitt
Joseph Gordon-Levitt原创
2025-03-06 10:34:09155浏览

gemini 1.5 Pro:深入研究Google的高级多模式AI及其API

Google的Gemini 1.5 Pro代表了AI的重大飞跃,在文本,视频和音频模式之间具有长篇文本的推理能力。该教程指导您连接并利用Gemini 1.5 Pro API来进行检索,问答和秘密学习等任务。 要对双子座家族有更广泛的了解,请探索此资源:什么是Google Gemini

。 双子座家族:一系列功能 Gemini AI家族由Google Research和Google DeepMind开发的几种生成AI模型。这些模型在各种多模式任务中表现出色,从而帮助开发人员进行内容创建和解决问题。 每个模型变体都是针对特定应用程序量身定制的,可在各种情况下优化性能。 家庭通过提供三个尺寸级别来平衡计算需求和功能:

本教程重点介绍Gemini 1.5 Pro,这是1.5系列中的首届模型。

gemini 1.5 Pro:前所未有的长篇小写理解

gemini 1.5 Pro的大量上下文窗口(至少1000万个令牌)使其能够理解各种应用程序的广泛背景。跨长依赖性任务进行严格的测试证明了其出色的功能。 它在“针中的针刺”场景中达到了接近完美的召回(> 99%),即使大草原超过1000万个令牌也是如此。 Gemini 1.5 Pro优于竞争者,包括使用外部检索方法的竞争对手,尤其是在需要理解大量内容相互依赖的任务上。 它执行秘密学习的能力,例如从单个语言文档中翻译新语言的能力,也非常出色。 这种增强的长篇小说性能不会损害其固有的多模式能力。它在各个领域(数学,科学和推理的28.9%)在其前任(Gemini 1.0 Pro)方面有了显着改善,甚至超过了许多基准中的Gemini 1.0 Ultra Model。

数据源。Gemini 1.5 Pro API Tutorial: Getting Started With Google's LLM 有关全面的详细信息,请参阅技术报告:“双子座1.5:在数百万个上下文中解锁多模式理解”。 Gemini 1.5 pro 的现实世界应用 gemini 1.5 Pro处理数百万个代币的能力为创新应用打开了门:

>

软件工程:它可以在大规模代码库中查明特定代码位置(例如,在746,152-token Jax Codebase中识别核心自动差异方法)。

)。

语言翻译:它可以在有限的在线数据的语言之间翻译,仅依赖于提供的上下文(例如,使用语法书籍和WordList从英语翻译为Kalamang)。 这显示了保存濒危语言的希望。
    >
  • >图像和视频分析:它可以在冗长的文本中识别场景(例如,根据草图找到一个场景
  • lesmisérables
  • )和视频(例如。 连接到双子座1.5 Pro API:逐步指南
  • >
  • >让我们探索如何通过其API访问双子座1.5 Pro的力量。 步骤1:获得API键
  • >
>导航到开发人员页面的Google AI(确保您登录)。 单击“获取API键”生成一个。 您需要设置一个项目。

Gemini 1.5 Pro API Tutorial: Getting Started With Google's LLM Gemini 1.5 Pro API Tutorial: Getting Started With Google's LLM

>步骤2:设置您的python环境

安装必要的python软件包:

pip install google-generativeai

>导入您的jupyter笔记本中所需的库:

import google.generativeai as genai
from google.generativeai.types import ContentType
from PIL import Image
from IPython.display import Markdown
import time
import cv2

>步骤3:进行API调用

>

>用键配置API:

GOOGLE_API_KEY = 'your-api-key-goes-here'
genai.configure(api_key=GOOGLE_API_KEY)

检查可用模型:

for m in genai.list_models():
    if 'generateContent' in m.supported_generation_methods:
        print(m.name)

>访问Gemini 1.5 Pro:

model = genai.GenerativeModel('gemini-1.5-pro-latest')

做一个简单的文本提示:

response = model.generate_content("Please provide a list of the most influential people in the world.")
print(response.text)

Gemini 1.5 Pro API Tutorial: Getting Started With Google's LLM

双子AI提供了多个响应候选者;选择最好的一个。

>

Gemini 1.5 Pro API Tutorial: Getting Started With Google's LLM

>带有双子座的图像提示1.5 pro

>

>让我们演示图像处理。 假设您有一个名为“ bookshelf.jpeg”的图像:

>

text_prompt = "List all the books and help me organize them into three categories."
bookshelf_image = Image.open('bookshelf.jpeg')
prompt = [text_prompt, bookshelf_image]
response = model.generate_content(prompt)
Markdown(response.text)

Gemini 1.5 Pro API Tutorial: Getting Started With Google's LLM Gemini 1.5 Pro API Tutorial: Getting Started With Google's LLM

结论

> Gemini 1.5 Pro具有其扩展上下文窗口和多模式功能,为各种应用程序提供了强大的工具。 它的API提供了使用不同数据类型的灵活性,使其成为开发人员的宝贵资产。 为了促进您的AI知识,请考虑此技能轨道: ai基础知识技能

以上是Gemini 1.5 Pro API教程:开始使用Google的LLM的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn