파이썬에서 Pinecone과 Openai가있는 챗봇 만들기
-
큰 언어 모델 (llms)
- 이미지 소스
-
GPT-4와 같은 llms는 인간 언어를 이해하고 생성하기 위해 딥 러닝 (특히 변압기 아키텍처)을 사용하는 정교한 기계 학습 알고리즘입니다. 대규모 데이터 세트 (다양한 온라인 소스의 수조 단어)에 대한 교육을받은 복잡한 언어 작업을 처리합니다.
창의적 작문에서 기술 문서에 이르기까지 다양한 스타일과 형식으로 텍스트 생성에서 XLLM이 뛰어납니다. 그들의 기능은 요약, 대화 AI 및 언어 번역이 포함되며, 종종 미묘한 언어 기능을 캡처합니다.
그러나 LLM에는 제한이 있습니다. "환각" - 그럴듯하지만 부정확 한 정보를 창출하고 훈련 데이터의 편견은 중요한 과제입니다. LLM은 주요 AI 발전을 나타내지 만, 신중한 관리는 위험을 완화하는 데 중요합니다. - 이미지 소스
-
헝겊 과정 (단순화) (세부 래그 튜토리얼은 별도로 사용할 수 있습니다.) - 데이터 준비 : 외부 데이터 (예 : 현재 연구, 뉴스)가 준비되어 LLM에서 사용할 수있는 형식 (임베딩)으로 변환됩니다. 임베딩 스토리지 : 임베딩은 벡터 데이터베이스 (Pinecone과 같은)에 저장되어 효율적인 벡터 데이터 검색에 최적화됩니다. 정보 검색 : 사용자의 쿼리 (벡터로 변환)를 사용한 의미 검색은 데이터베이스에서 가장 관련성이 높은 정보를 검색합니다. 프롬프트 증강 : 검색된 데이터와 사용자 쿼리는 LLM 프롬프트를 늘려서보다 정확한 응답을 초래합니다. 데이터 업데이트 : 외부 데이터가 정기적으로 업데이트되어 정확도를 유지합니다.
-
벡터 데이터베이스 이미지 소스 -
OpenAi의 API는 GPT, Dall-E 및 Whisper와 같은 모델에 대한 액세스를 제공합니다. HTTP 요청을 통해 액세스 할 수 있거나 (또는 Python의 라이브러리로 단순화) 다양한 프로그래밍 언어로 쉽게 통합됩니다. 파이썬 예 : langchain (프레임 워크 개요) Langchain은 LLM 애플리케이션 개발을 단순화합니다. 강력하지만 여전히 활발한 개발 중이므로 API 변경이 가능합니다. -
이 섹션에서는 OpenAi GPT-4 및 Pinecone을 사용하여 챗봇을 구축합니다. (참고 :이 코드의 대부분은 공식 Pinecone Langchain 안내서에서 수정되었습니다.)
1. Openai 및 Pinecone 설정 : API 키를 얻습니다
2. 라이브러리 설치 : PIP를 사용하여 ,,
4. PENECONE 인덱스 설정 : PENECONE Index를 만듭니다 (이 예에서는langchain
,langchain-community
, openai 및 tiktoken를 설치하십시오.pinecone-client
3. 샘플 데이터 세트 : 사전에 매달린 데이터 세트를로드하십시오 (예를 들어, pinecone-datasets). 더 빠른 처리를 위해서는 서브 세트 샘플링이 권장됩니다.)).
6. Langchain Integration : Pinecone Index 및 Openai Embeddings를 사용하여 Langchain 벡터 저장소 초기화.wikipedia-simple-text-embedding-ada-002-100K
5. 데이터 삽입 : 샘플링 된 데이터를 Pinecone 인덱스로 향상시킵니다.pinecone-datasets
7. 쿼리 : 벡터 스토어를 사용하여 유사성 검색을 수행하십시오
langchain-retrieval-augmentation-fast
8. LLM 통합 : LLM을 벡터 저장소와 통합하려면 및 (또는 )를 사용하십시오.결론 이 블로그는 신뢰할 수 있고 관련 LLM 구동 챗봇을 구축하기위한 Rag의 힘을 보여주었습니다. LLM, 벡터 데이터베이스 (Pinecone) 및 Langchain과 같은 프레임 워크의 조합은 개발자가 정교한 대화 AI 애플리케이션을 만들 수 있도록합니다. 우리의 과정은이 분야에서 추가 학습 기회를 제공합니다.
벡터 데이터베이스는 고차원 벡터 (수학적 데이터 표현)를 관리합니다. 벡터 거리를 기반으로 유사성 검색에서 탁월하여 의미 쿼리가 가능합니다. 응용 프로그램에는 유사한 이미지, 문서 또는 제품 찾기가 포함됩니다. Pinecone은 인기 있고 효율적이며 사용자 친화적 인 예입니다. 고급 인덱싱 기술은 RAG 응용 프로그램에 이상적입니다 Openai API 엔드 투 엔드 파이썬 예 : LLM 챗봇 구축
위 내용은 OpenAI API & Pinecone을 사용하여 챗봇을 만드는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

AI 필드의 평가 지표로서 "VIBES"의 사용이 상승하는 것을 논의합시다. 이 분석은 AI 발전에 대한 진행중인 Forbes 열의 일부이며 AI 개발의 복잡한 측면을 탐색합니다 (여기 링크 참조). AI 평가의 분위기 트레이디

Waymo 's Arizona Factory : 대량 생산 자율 주행 재규어 및 그 이상 애리조나 주 피닉스 근처에 위치한 Waymo는 자율적 인 재규어 I-Pace Electric SUV를 생산하는 최첨단 시설을 운영하고 있습니다. 이 239,000 평방 피트 규모의 공장이 문을 열었습니다

S & P Global의 최고 디지털 솔루션 책임자 인 Jigar Kocherlakota는 회사의 AI 여정, 전략적 인수 및 미래 중심의 디지털 혁신에 대해 논의합니다. 혁신적인 리더십 역할과 미래의 준비 팀 코카 랄라코타의 역할

앱에서 생태계까지 : 디지털 환경 탐색 디지털 혁명은 소셜 미디어와 AI를 훨씬 넘어서고 있습니다. 우리는 "Everything Apps"의 부상을 목격하고 있습니다. 샘 a

Mas Visa의 AI 기반 거래 기능은 헤드 라인을 만들었지 만 Mastercard는 대리인 지불을 발표했습니다.

Future Ventures Fund IV : 소설 기술에 대한 $ 200m 베팅 Future Ventures는 최근 초과 구매 펀드 IV를 마감하여 총 2 억 달러를 마감했습니다. Steve Jurvetson, Maryanna Saenko 및 Nico Enriquez가 관리하는이 새로운 펀드는 중요한 Inv를 나타냅니다.

AI 애플리케이션이 폭발적으로 증가함에 따라 기업은 기존 검색 엔진 최적화 (SEO)에서 생성 엔진 최적화 (GEO)로 이동하고 있습니다. Google은 변화를 이끌고 있습니다. "AI 개요"기능은 10 억 명 이상의 사용자에게 제공되어 사용자가 링크를 클릭하기 전에 전체 답변을 제공합니다. [^2] 다른 참가자들도 빠르게 상승하고 있습니다. Chatgpt, Microsoft Coplot 및 Perplexity는 전통적인 검색 결과를 완전히 우회하는 새로운 "답변 엔진"범주를 만들고 있습니다. 이 AI 생성 답변에 비즈니스가 나타나지 않으면 잠재 고객이 전통적인 검색 결과에서 높은 순위를 차지한 경우에도 잠재 고객이 귀하를 찾지 못할 수 있습니다. SEO에서 GEO까지 - 이것은 정확히 무엇을 의미합니까? 수십 년 동안

인공 일반 정보 (AGI)의 잠재적 경로를 탐색합시다. 이 분석은 AI 전진에 대한 진행중인 Forbes 칼럼의 일부이며, AGI 및 인공 초 지성 (ASI)을 달성하는 복잡성을 탐구합니다. (관련 예술 참조


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

에디트플러스 중국어 크랙 버전
작은 크기, 구문 강조, 코드 프롬프트 기능을 지원하지 않음

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

PhpStorm 맥 버전
최신(2018.2.1) 전문 PHP 통합 개발 도구

VSCode Windows 64비트 다운로드
Microsoft에서 출시한 강력한 무료 IDE 편집기

mPDF
mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.