집 >기술 주변기기 >일체 포함 >Gemini 1.5 Pro API 튜토리얼 : Google의 시작하기

Gemini 1.5 Pro API 튜토리얼 : Google의 시작하기

Joseph Gordon-Levitt원래의: 2025-03-06 10:34:09155검색

gemini 1.5 Pro : Google의 고급 멀티 모달 AI와 그 API 에 대한 깊은 다이빙 Google의 Gemini 1.5 Pro는 AI에서 상당한 도약을 나타내며 텍스트, 비디오 및 오디오 모드에서 장기 컨텍스트 추론 기능을 자랑합니다. 이 튜토리얼은 검색, 질문 답변 및 텍스트 내 학습과 같은 작업을 위해 Gemini 1.5 Pro API를 연결하고 활용하여 안내합니다. Gemini 가족에 대한 광범위한 이해를 위해이 자원을 탐구하십시오. Google Gemini
. gemini 가족 : 스펙트럼의 기능 Gemini AI 제품군은 Google Research 및 Google Deepmind가 개발 한 여러 생성 AI 모델로 구성됩니다. 이러한 모델은 다양한 멀티 모달 작업에서 뛰어나며 개발자가 컨텐츠 생성 및 문제 해결을 지원합니다. 각 모델 변형은 특정 응용 프로그램에 맞게 조정되어 다양한 시나리오에서 성능을 최적화합니다. 가족은 3 가지 크기의 계층을 제공함으로써 계산 요구와 기능의 균형을 이룹니다.
이 튜토리얼은 1.5 시리즈의 첫 모델 인 Gemini 1.5 Pro에 중점을 둡니다. gemini 1.5 Pro : 전례없는 장기 텍스트 이해 Gemini 1.5 Pro의 실질적인 컨텍스트 창 (최소 1 천만 개의 토큰)을 통해 다양한 응용 분야에서 광범위한 컨텍스트를 이해할 수 있습니다. 장기 의존성 작업에서 엄격한 테스트는 뛰어난 기능을 보여줍니다. 건초 더미가 1 천만 마리의 토큰을 초과하는 경우에도 "바늘 in-a-haystack"시나리오에서 거의 완벽한 리콜 (& gt; 99%)을 달성했습니다. Gemini 1.5 Pro는 외부 검색 방법을 사용하는 것, 특히 방대한 양의 컨텐츠에 대한 상호 의존성을 이해해야하는 작업을 포함하여 경쟁 업체를 능가했습니다. 단일 언어 문서에서 새로운 언어를 번역하는 것과 같이 텍스트 내 학습을 수행하는 능력도 놀랍습니다. 이 향상된 장기 텍스트 성능은 고유의 다중 모드 능력을 손상시키지 않습니다. 다양한 영역 (수학, 과학 및 추론에서 28.9%)에서 이전 모델 (Gemini 1.0 Pro)에 비해 크게 개선되었으며, 많은 벤치 마크에서 Gemini 1.0 Ultra 모델을 능가했습니다.
.

데이터 소스 포괄적 인 세부 사항은 기술 보고서를 참조하십시오.“Gemini 1.5 : 수백만의 컨텍스트에 걸쳐 멀티 모달 이해 잠금 해제”. gemini 1.5 pro 의 실제 응용 프로그램 gemini 1.5 프로의 처리 능력은 수백만 개의 토큰을 혁신적인 응용 프로그램에 열어줍니다.
소프트웨어 엔지니어링 :
는 대규모 코드베이스 내에서 특정 코드 위치를 정확히 찾아 낼 수 있습니다 (예 : 746,152-Token Jax 코드베이스 내에서 핵심 자동 차별화 방법을 식별). 언어 번역 : 는 온라인 데이터가 제한된 언어로 번역 할 수 있으며, 제공된 컨텍스트에만 의존합니다 (예 : 문법 책과 Wordlist를 사용하여 영어에서 Kalamang으로 번역). 이것은 멸종 위기에 처한 언어를 보존한다는 약속을 보여줍니다.
이미지 및 비디오 분석 : 긴 텍스트 내에서 장면을 식별 할 수 있습니다 (예 : Les misérables 에서 스케치를 기반으로 한 장면을 찾기) 및 비디오 (예 : "Sherlock Jr."의 특정 프레임에서 정보를 추출하고 스케치에서 장면을 식별). Gemini 1.5 Pro API에 연결 API를 통해 Gemini 1.5 Pro의 힘에 액세스하는 방법을 살펴 보겠습니다. 1 단계 : API 키를 얻으십시오 개발자 페이지의 Google AI로 이동합니다 (로그인한지 확인). "API 키 얻기"를 클릭하여 하나를 생성하십시오. 프로젝트를 설정해야합니다.
2 단계 : 파이썬 환경을 설정하십시오

필요한 파이썬 패키지를 설치하십시오 :

Jupyter 노트에서 필수 라이브러리를 가져 오십시오 : 3 단계 : API 호출
키로 API를 구성하십시오
<:> 사용 가능한 모델 점검 :
액세스 쌍둥이 자리 1.5 프로 :
pip install google-generativeai
간단한 텍스트 프롬프트를 만듭니다

import google.generativeai as genai from google.generativeai.types import ContentType from PIL import Image from IPython.display import Markdown import time import cv2
gemini ai는 다수의 응답 후보를 제공합니다. 가장 좋은 것을 선택하십시오.
Gemini 1.5 Pro 이미지 이미지 처리를 시연합시다. "bookshelf.jpeg": 라는 이미지가 있다고 가정하십시오

결론 gemini 1.5 Pro는 확장 된 컨텍스트 창과 멀티 모달 기능을 갖춘 다양한 응용 프로그램을위한 강력한 도구를 제공합니다. API는 다양한 데이터 유형으로 작업 할 수있는 유연성을 제공하여 개발자에게 귀중한 자산이됩니다. AI 지식을 더욱 발전 시키려면이 기술 트랙을 고려하십시오.

위 내용은 Gemini 1.5 Pro API 튜토리얼 : Google의 시작하기의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

Python Resource for math Token using this promise jupyter prompt Access excel Translate Prompt

성명：

이전 기사：Google Gemini 2.0 Pro vs Deepseek-R1 : 코딩 전투다음 기사：Google Gemini 2.0 Pro vs Deepseek-R1 : 코딩 전투