搜索
首页科技周边人工智能Gemini 1.5 Pro API教程:开始使用Google的LLM

gemini 1.5 Pro:深入研究Google的高级多模式AI及其API

Google的Gemini 1.5 Pro代表了AI的重大飞跃,在文本,视频和音频模式之间具有长篇文本的推理能力。该教程指导您连接并利用Gemini 1.5 Pro API来进行检索,问答和秘密学习等任务。 要对双子座家族有更广泛的了解,请探索此资源:什么是Google Gemini

。 双子座家族:一系列功能 Gemini AI家族由Google Research和Google DeepMind开发的几种生成AI模型。这些模型在各种多模式任务中表现出色,从而帮助开发人员进行内容创建和解决问题。 每个模型变体都是针对特定应用程序量身定制的,可在各种情况下优化性能。 家庭通过提供三个尺寸级别来平衡计算需求和功能:

本教程重点介绍Gemini 1.5 Pro,这是1.5系列中的首届模型。

gemini 1.5 Pro:前所未有的长篇小写理解

gemini 1.5 Pro的大量上下文窗口(至少1000万个令牌)使其能够理解各种应用程序的广泛背景。跨长依赖性任务进行严格的测试证明了其出色的功能。 它在“针中的针刺”场景中达到了接近完美的召回(> 99%),即使大草原超过1000万个令牌也是如此。 Gemini 1.5 Pro优于竞争者,包括使用外部检索方法的竞争对手,尤其是在需要理解大量内容相互依赖的任务上。 它执行秘密学习的能力,例如从单个语言文档中翻译新语言的能力,也非常出色。 这种增强的长篇小说性能不会损害其固有的多模式能力。它在各个领域(数学,科学和推理的28.9%)在其前任(Gemini 1.0 Pro)方面有了显着改善,甚至超过了许多基准中的Gemini 1.0 Ultra Model。

数据源。Gemini 1.5 Pro API Tutorial: Getting Started With Google's LLM 有关全面的详细信息,请参阅技术报告:“双子座1.5:在数百万个上下文中解锁多模式理解”。 Gemini 1.5 pro 的现实世界应用 gemini 1.5 Pro处理数百万个代币的能力为创新应用打开了门:

>

软件工程:它可以在大规模代码库中查明特定代码位置(例如,在746,152-token Jax Codebase中识别核心自动差异方法)。

)。

语言翻译:它可以在有限的在线数据的语言之间翻译,仅依赖于提供的上下文(例如,使用语法书籍和WordList从英语翻译为Kalamang)。 这显示了保存濒危语言的希望。
    >
  • >图像和视频分析:它可以在冗长的文本中识别场景(例如,根据草图找到一个场景
  • lesmisérables
  • )和视频(例如。 连接到双子座1.5 Pro API:逐步指南
  • >
  • >让我们探索如何通过其API访问双子座1.5 Pro的力量。 步骤1:获得API键
  • >
>导航到开发人员页面的Google AI(确保您登录)。 单击“获取API键”生成一个。 您需要设置一个项目。

Gemini 1.5 Pro API Tutorial: Getting Started With Google's LLM Gemini 1.5 Pro API Tutorial: Getting Started With Google's LLM

>步骤2:设置您的python环境

安装必要的python软件包:

pip install google-generativeai

>导入您的jupyter笔记本中所需的库:

import google.generativeai as genai
from google.generativeai.types import ContentType
from PIL import Image
from IPython.display import Markdown
import time
import cv2

>步骤3:进行API调用

>

>用键配置API:

GOOGLE_API_KEY = 'your-api-key-goes-here'
genai.configure(api_key=GOOGLE_API_KEY)

检查可用模型:

for m in genai.list_models():
    if 'generateContent' in m.supported_generation_methods:
        print(m.name)

>访问Gemini 1.5 Pro:

model = genai.GenerativeModel('gemini-1.5-pro-latest')

做一个简单的文本提示:

response = model.generate_content("Please provide a list of the most influential people in the world.")
print(response.text)

Gemini 1.5 Pro API Tutorial: Getting Started With Google's LLM

双子AI提供了多个响应候选者;选择最好的一个。

>

Gemini 1.5 Pro API Tutorial: Getting Started With Google's LLM

>带有双子座的图像提示1.5 pro

>

>让我们演示图像处理。 假设您有一个名为“ bookshelf.jpeg”的图像:

>

text_prompt = "List all the books and help me organize them into three categories."
bookshelf_image = Image.open('bookshelf.jpeg')
prompt = [text_prompt, bookshelf_image]
response = model.generate_content(prompt)
Markdown(response.text)

Gemini 1.5 Pro API Tutorial: Getting Started With Google's LLM Gemini 1.5 Pro API Tutorial: Getting Started With Google's LLM

结论

> Gemini 1.5 Pro具有其扩展上下文窗口和多模式功能,为各种应用程序提供了强大的工具。 它的API提供了使用不同数据类型的灵活性,使其成为开发人员的宝贵资产。 为了促进您的AI知识,请考虑此技能轨道: ai基础知识技能

以上是Gemini 1.5 Pro API教程:开始使用Google的LLM的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
AI游戏开发通过Upheaval的Dreamer Portal进入其代理时代AI游戏开发通过Upheaval的Dreamer Portal进入其代理时代May 02, 2025 am 11:17 AM

动荡游戏:与AI代理商的游戏开发彻底改变 Roupheaval是一家游戏开发工作室,由暴风雪和黑曜石等行业巨头的退伍军人组成,有望用其创新的AI驱动的Platfor革新游戏创作

Uber想成为您的Robotaxi商店,提供商会让他们吗?Uber想成为您的Robotaxi商店,提供商会让他们吗?May 02, 2025 am 11:16 AM

Uber的Robotaxi策略:自动驾驶汽车的骑车生态系统 在最近的Curbivore会议上,Uber的Richard Willder推出了他们成为Robotaxi提供商的乘车平台的策略。 利用他们在

AI代理玩电子游戏将改变未来的机器人AI代理玩电子游戏将改变未来的机器人May 02, 2025 am 11:15 AM

事实证明,视频游戏是尖端AI研究的宝贵测试场所,尤其是在自主代理和现实世界机器人的开发中,甚至有可能促进人工通用智能(AGI)的追求。 一个

创业公司工业综合体VC 3.0和James Currier的宣言创业公司工业综合体VC 3.0和James Currier的宣言May 02, 2025 am 11:14 AM

不断发展的风险投资格局的影响在媒体,财务报告和日常对话中显而易见。 但是,对投资者,初创企业和资金的具体后果经常被忽略。 风险资本3.0:范式

Adobe在Adobe Max London 2025更新创意云和萤火虫Adobe在Adobe Max London 2025更新创意云和萤火虫May 02, 2025 am 11:13 AM

Adobe Max London 2025对Creative Cloud和Firefly进行了重大更新,反映了向可访问性和生成AI的战略转变。 该分析结合了事件前简报中的见解,并融合了Adobe Leadership。 (注意:Adob

Llamacon宣布的所有元数据Llamacon宣布的所有元数据May 02, 2025 am 11:12 AM

Meta的Llamacon公告展示了一项综合的AI策略,旨在直接与OpenAI等封闭的AI系统竞争,同时为其开源模型创建了新的收入流。 这个多方面的方法目标bo

关于AI仅仅是普通技术的主张的酿造争议关于AI仅仅是普通技术的主张的酿造争议May 02, 2025 am 11:10 AM

人工智能领域对这一论断存在严重分歧。一些人坚称,是时候揭露“皇帝的新衣”了,而另一些人则强烈反对人工智能仅仅是普通技术的观点。 让我们来探讨一下。 对这一创新性人工智能突破的分析,是我持续撰写的福布斯专栏文章的一部分,该专栏涵盖人工智能领域的最新进展,包括识别和解释各种有影响力的人工智能复杂性(请点击此处查看链接)。 人工智能作为普通技术 首先,需要一些基本知识来为这场重要的讨论奠定基础。 目前有大量的研究致力于进一步发展人工智能。总目标是实现人工通用智能(AGI)甚至可能实现人工超级智能(AS

模型公民,为什么AI值是下一个业务码模型公民,为什么AI值是下一个业务码May 02, 2025 am 11:09 AM

公司AI模型的有效性现在是一个关键的性能指标。自AI BOOM以来,从编写生日邀请到编写软件代码的所有事物都将生成AI使用。 这导致了语言mod的扩散

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

SecLists

SecLists

SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合,这些列表在安全评估过程中经常使用,都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表,帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上,他就可以访问到所需的每种类型的列表。

Atom编辑器mac版下载

Atom编辑器mac版下载

最流行的的开源编辑器

EditPlus 中文破解版

EditPlus 中文破解版

体积小,语法高亮,不支持代码提示功能

PhpStorm Mac 版本

PhpStorm Mac 版本

最新(2018.2.1 )专业的PHP集成开发工具

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中