PENECONE CANOPY : 생성 AI 를위한 간소화 된 래그 프레임 워크
AWS와 Yahoo의 전 연구 책임자 인 Edo Liberty는 AI 모델과 벡터 검색을 결합하는 변형력을 인정했습니다. 이 통찰력은 2019 년에 최첨단 AI 애플리케이션에 대한 액세스를 민주화하도록 설계된 벡터 데이터베이스 인 Pinecone을 생성했습니다. 이 기초를 바탕으로 Pinecone은 최근 오픈 소스 검색 증강 생성 (RAG) 프레임 워크 인 Canopy를 시작했습니다.
Canopy는 복잡한 걸레 작업을 자동화하여 생성 AI 애플리케이션의 개발을 단순화합니다. 여기에는 채팅 기록 관리, 텍스트 청크 및 임베딩, 쿼리 최적화, 컨텍스트 검색 (프롬프트 엔지니어링 포함) 및 증강 생성이 포함됩니다. 그 결과 생산 준비 RAG 애플리케이션을 배포하는 경로가 훨씬 빠르고 쉬운 경로가 있습니다. Pinecone은 사용자가 한 시간 안에이를 달성 할 수 있다고 주장합니다.
피네콘 캐노피의 주요 특징과 장점 :
프리 티어 :
최대 100,000 개의 임베딩 (약 1,500 만 단어 또는 30,000 페이지)을 지원하는 무료 계층에 액세스하십시오. 미래를 위해 무료 임베딩 모델과 LLM이 계획되어 있습니다.
사용 편의성 :
는 다양한 데이터 형식 (JSONL, PARQUET, PLAIN TEXT, PDF 지원이 곧 제공됨)을 지원합니다. GPT-4 터보를 포함한 OpenAI LLM과의 원활한 통합 및 기타 LLM 및 임베딩 모델에 대한 향후 지원.
확장 성 : 규모의 신뢰할 수 있고 고성능 Genai 응용 프로그램을 위해 Pinecone의 강력한 벡터 데이터베이스를 활용합니다.
유연성 :
모듈 식 및 확장 가능한 설계를 통해 사용자 정의 애플리케이션 개발이 가능합니다. REST API를 통해 웹 서비스로 배포 할 수 있으며 기존 OpenAI 응용 프로그램에 쉽게 통합됩니다.
반복 개발 : - 대화식 CLI는 RAG 및 비 방해 워크 플로를 쉽게 비교하여 반복 개발 및 평가를 용이하게 할 수 있습니다.
피네콘 캐노피 환경 설정 :
-
계정 설정 : Pinecone 표준 또는 엔터프라이즈 계정에 등록하십시오. 무료 POD 기반 지수는 신용 카드없이 사용할 수 있습니다. 신규 사용자는 서버리스 크레딧으로 $ 100를받습니다
설치 : - 를 사용하여 Canopy SDK를 설치하십시오. 가상 환경 (예 : ) 사용이 권장됩니다
API 키 :
Pinecone 콘솔 (API 키 섹션)에서 - 를 얻으십시오. 다음 환경 변수를 설정하십시오 : , 및
(선택 사항; 생략되면 기본값이 사용됩니다). 명령 (예 : )을 사용하십시오
-
검증 : 로 설치를 확인하십시오. 성공적인 설치는 "Canopy : Ready"메시지 및 사용 지침을 표시합니다.
첫 번째 Pinecone Canopy 프로젝트 :
canopy
색인 생성 :
를 사용하여 새로운 PENECONE 색인을 만들고 CLI 프롬프트를 따르십시오. 인덱스 이름에는 접두사가 있습니다.
데이터 업시 션 : 를 사용하여 데이터를로드, 데이터 디렉토리 또는 파일 (JSONL, PARQUET, CSV 또는 PLAIN TEXT)의 경로를 지정합니다. 기록을 작성하거나 덮어 쓰려면 - 를 사용하십시오. 부분 레코드 수정에
를 사용하십시오. 대형 데이터 세트의 경우 100 이하의 그룹의 배치 업이.
서버 시작 : canopy new
로 캐노피 서버를 시작하십시오. 이것은 채팅 애플리케이션과의 통합을 위해 를 통해 액세스 할 수있는 REST API를 시작합니다.
canopy--
캐노피 아키텍처 :
캐노피는 세 가지 핵심 구성 요소를 포함합니다 :
- 지식 기반 :
헝겊에 대한 데이터를 준비하고, 텍스트를 청킹하고, Pinecone에 저장을위한 임베드를 생성합니다.
컨텍스트 엔진 : 쿼리를 기반으로 Pinecone에서 관련 문서를 검색하여 LLM의 컨텍스트를 만듭니다.
캐노피 채팅 엔진 : canopy upsert
채팅 기록, 쿼리 생성 및 응답 합성을 포함한 완전한 래그 워크 플로우를 관리합니다.
upsert
고급 기능 및 모범 사례 :
update
스케일링 :
스케일 피네콘 인덱스는 큰 데이터 세트를 처리하기 위해 수직 (더 많은 리소스) 또는 가로 (더 많은 기계)를 인덱싱합니다. 효율적인 쿼리를 위해 네임 스페이스를 사용하여 데이터를 분할하십시오
성능 최적화 : rag 성능과 정확도를 최적화하기 위해 데이터를 준비 할 때 청크 크기를 고려하십시오.
-
결론 :
Pinecone Canopy는 Rag 응용 프로그램을 구축하는 사용자 친화적이고 효율적인 방법을 제공합니다. 간소화 된 워크 플로 및 강력한 기능은 모든 기술 수준의 개발자에게 생성 AI의 강제력을 활용할 수 있도록 강화합니다. 추가 학습 및 사례를위한 제공된 링크를 탐색하십시오.
(캐노피의 건축물을 보여주는 다이어그램)
위 내용은 Pinecone Canopy를 사용하여 지능형 응용 프로그램 구축 : 초보자 가이드의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!