weaviate는 Docker Compose (권장) 또는 수동 설치를 통해 쉽게 설치됩니다. 설치 후 간단한 쿼리로 기능을 확인하십시오. Docker Compose의 경우 :
기타 배포 옵션으로는 Weaviate의 Managed Cloud Service 및 AWS Marketplace가 포함됩니다. Python 클라이언트는 PIP를 사용하여 설치됩니다
핵심 weaviate 개념
데이터 객체 : 데이터 항목은 "클래스"로 구성되어 있으며 각각 "속성"이 정의되어 있습니다. 각 객체는 벡터로 표시됩니다
모듈 : - weaviate의 기능 (벡터화, 백업 등)을 확장합니다. 핵심 엔진은 모듈이없는 경우에도 벡터 데이터베이스 역할을합니다.
저장소 :
는 실시간의 신뢰할 수있는 데이터 지속성을 강력한 실패 처리로 제공합니다. 쿼리는 ID뿐만 아니라 완전한 데이터 객체를 반환합니다. 필터링은 - 벡터가 정확한 결과 수를 검색하기 전에 발생합니다
GraphQL : Weaviate의 기본 인터페이스로 REST와 비교하여 효율적이고 유연한 데이터 액세스를 제공합니다. 그래프 기반 특성은 교차 참조 데이터로 탁월합니다
-
이미지 소스
클래스와 객체 생성
클래스는 데이터 구조를 정의합니다. 수동으로 만들거나 Weaviate의 Autoschema 기능을 사용할 수 있습니다. 수동 클래스 생성의 파이썬 예는 다음과 같습니다
벡터화 및 속성을 포함한보다 포괄적 인 예 :
객체는 클래스에 추가됩니다. 벡터는 weaviate에 의해 명시 적으로 제공되거나 생성 될 수 있습니다
-
엔드 투 엔드 파이썬 예
이 예제는 Python 클라이언트를 사용하여 클래스를 생성하고 객체를 추가하는 것을 보여줍니다. 클라이언트 ()를 설치하고 WeAviate 인스턴스 (클라우드 또는 내장)를 실행하는 것을 잊지 마십시오.
데이터 소스 (크레딧 : Weaviate 공무원)
weaviate 모범 사례
스키마 설계 : 고유 식별자와 의미 유형을 가진 유연하고 확장 가능한 스키마.
데이터 가져 오기 : 자동화를위한 효율 및 휴식 API를 위해 배치 가져 오기를 활용합니다. 지원되는 형식 (JSON, CSV)을 사용하십시오
쿼리 최적화 : 최적의 성능을 위해 그래프 QL, Pagination 및 Caching을 활용하십시오.
ChromADB는 또 다른 우수한 오픈 소스 벡터 데이터베이스 옵션을 제공합니다. 자세한 내용은 ChromADB 튜토리얼을 탐색하십시오
결론
Weaviate는 구조화되지 않은 데이터를 관리하고 쿼리하기위한 강력하고 유연한 솔루션을 제공합니다. 사용자 친화적 인 GraphQL 인터페이스 및 Python 클라이언트와 결합 된 벡터 기반 접근 방식은 다양한 기계 학습 및 AI 응용 프로그램에 이상적인 선택입니다. 지식을 더욱 향상시키기 위해 "Python in Python을 사용한 데이터 과학을위한 벡터 데이터베이스"에서 웹 세미나를 탐색하십시오.