목표
해리포터 세계에 관한 모든 것을 손끝에서 보고 싶은 해리포터 팬이신가요? 아니면 단순히 해리포터의 다양한 캐릭터가 어떻게 결합되는지에 대한 멋진 차트로 친구들에게 깊은 인상을 남기고 싶으신가요? 지식 그래프만 보면 됩니다.
이 가이드는 노트북과 좋아하는 책만으로 Neo4J에서 지식 그래프를 얻는 방법을 보여줍니다.
지식그래프란 무엇인가
Wikipedia에 따르면:
지식 그래프는 그래프 구조의 데이터 모델이나 토폴로지를 이용해 데이터를 표현하고 연산하는 지식 베이스입니다.
뭐가 필요하세요
하드웨어 측면에서 필요한 것은 컴퓨터뿐입니다. 가급적 Nvidia 그래픽 카드가 장착된 컴퓨터가 좋습니다. 완전히 자급자족하기 위해 로컬 LLM 설정을 사용하겠지만 동일한 목적으로 OpenAI API를 쉽게 사용할 수도 있습니다.
설정 단계
다음이 필요합니다:
- Ollama와 여러분이 가장 좋아하는 LLM 모델
- 파이썬 환경
- Neo4J
올라마
WSL2에서 Ubuntu 24.04로 코딩하면서 GPU 작업 부하를 쉽게 통과시키기 위해 Ollama docker를 사용하고 있습니다. Ollama를 Docker 컨테이너로 실행하는 것은 먼저 Nvidia 컨테이너 툴킷을 설치한 후 다음을 수행하는 것만큼 간단합니다.
docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
Nvidia GPU가 없는 경우 CLI에서 다음 명령을 사용하여 CPU 전용 Ollama를 실행할 수 있습니다.
docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
완료되면 좋아하는 LLM 모델을 Ollama로 가져올 수 있습니다. Ollama에서 사용 가능한 모델 목록은 여기에서 확인하세요. 예를 들어 qwen2.5를 가져오려면 CLI에서 다음 명령을 실행할 수 있습니다.
docker exec -it ollama ollama run qwen2.5
Ollama가 끝났습니다!
Python 환경
먼저 Python 가상 환경을 생성하여 설치한 패키지나 구성 변경 사항을 전역적으로 적용하는 대신 환경 내에서만 제한하도록 할 것입니다. 다음 명령은 가상 환경 harry-potter-rag를 생성합니다:
python -m venv harry-potter-rag
그런 다음 다음 명령을 사용하여 가상 환경을 활성화할 수 있습니다.
source tutorial-env/bin/activate
다음으로 pip를 사용하여 주로 LangChain에서 관련 패키지를 설치합니다.
%pip install --upgrade --quiet langchain langchain-community langchain-openai langchain-experimental neo4j
Neo4J 설정
Neo4J를 도커 컨테이너로 설정하겠습니다. 특정 구성을 쉽게 설정할 수 있도록 docker compose를 사용합니다. 다음을 docker-compose.yaml이라는 파일에 복사한 다음 동일한 디렉터리에서 docker-compose up -d를 실행하여 Neo4J를 설정할 수 있습니다.
이 설정은 또한 데이터, 로그 및 플러그인이 로컬 폴더(예: /data)에 유지되도록 보장합니다. /로그 및 플러그인.
docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
지식 그래프 구축
이제 Jupyter Notebook에서 지식 그래프 구축을 시작할 수 있습니다! 먼저 다음을 사용하여 Ollama LLM 인스턴스를 설정했습니다.
docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
다음으로 LLM을 Neo4J에 연결합니다.
docker exec -it ollama ollama run qwen2.5
이제 좋아하는 해리포터 텍스트나 좋아하는 책을 선택하고 LangChain을 사용하여 텍스트를 덩어리로 분할할 차례입니다. 청킹은 긴 텍스트를 여러 부분으로 나누는 전략이며, 그런 다음 각 부분을 LLM으로 보내 이를 노드와 에지로 변환하고 각 청크의 노드와 에지를 Neo4J에 삽입할 수 있습니다. 간단한 입문서입니다. 노드는 그래프에 표시되는 원이며 각 가장자리는 두 개의 노드를 함께 연결합니다.
코드는 청크가 어떻게 생겼는지 빠르게 미리 볼 수 있도록 첫 번째 청크도 인쇄합니다.
python -m venv harry-potter-rag
이제 GPU가 무거운 작업을 수행하고 텍스트를 지식 그래프로 변환할 때입니다! 책 전체를 자세히 살펴보기 전에 LLM이 원하는 방식으로 그래프를 반환하도록 더 나은 안내를 제공하는 프롬프트를 실험해 보겠습니다.
프롬프트는 기본적으로 우리가 기대하는 것의 예이거나 응답에 표시하려는 내용에 대한 지침입니다. 지식 그래프의 맥락에서 우리는 LLM에게 사람과 조직만 노드로 추출하고 엔터티가 제공된 특정 유형의 관계만 허용하도록 지시할 수 있습니다. 예를 들어, 배우자 관계는 개인과 조직 사이가 아닌 개인과 개인 사이에서만 이루어지도록 허용할 수 있습니다.
이제 첫 번째 텍스트 덩어리에 LLMGraphTransformer를 사용하여 그래프가 어떻게 나타나는지 확인할 수 있습니다. 결과가 마음에 들 때까지 프롬프트를 조정할 수 있는 좋은 기회입니다.
다음 예에서는 개인 또는 조직이 될 수 있는 노드를 예상하며 allowed_relationships는 허용되는 관계 유형을 지정합니다. LLM이 원본 텍스트의 다양성을 캡처할 수 있도록 strict_mode도 False로 설정하여 아래에 정의되지 않은 다른 관계나 엔터티도 캡처할 수 있습니다. 대신 strict_mode를 True로 설정하면 허용되는 항목을 준수하지 않는 엔터티 및 관계가 삭제되거나 허용되는 항목으로 강제 실행될 수 있습니다(정확하지 않을 수 있음).
source tutorial-env/bin/activate
프롬프트를 미세 조정한 후 만족스러우면 이제 지식 정보를 수집할 차례입니다. try - Except는 Neo4J에 제대로 삽입될 수 없는 모든 응답을 명시적으로 처리하는 것입니다. 코드는 모든 오류가 기록되도록 설계되었지만 후속 청크를 그래프로 변환하면서 루프가 계속 진행되는 것을 차단하지 않습니다. 🎜>
docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
위 루프에서는 해리포터와 마법사의 돌, 해리포터와 비밀의 방, 해리포터와 아즈카반의 죄수를 섭취하는 데 약 46분이 걸렸습니다. 결국 4868개의 고유 노드가 생겼습니다! 아래에서 빠른 미리보기를 볼 수 있습니다. 그래프가 정말 붐비고, 누가 누구와 어떤 방식으로 관련되어 있는지 구분하기 어려운 것을 볼 수 있습니다.
이제 암호 쿼리를 활용하여 Dumbledore를 살펴볼 수 있습니다!
docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
자, 이제 덤블도어 본인만 알겠습니다. 해리포터와 어떤 연관이 있는지 알아보겠습니다.
docker exec -it ollama ollama run qwen2.5
자, 이제 우리는 해리와 덤블도어가 말한 내용에 관심이 있습니다.
python -m venv harry-potter-rag
우리가 찾고 있는 것을 실제로 찾기 위해 거쳐야 할 문서가 많아 그래프가 여전히 매우 혼란스럽다는 것을 알 수 있습니다. 문서를 노드로 모델링하는 것이 이상적이지 않다는 것을 알 수 있으며 그래프를 보다 직관적으로 사용하기 위해 LLMGraphTransformer에서 추가 작업을 수행할 수 있습니다.
결론
인터넷에 연결하지 않고도 로컬 컴퓨터에 지식 정보를 설정하는 것이 얼마나 쉬운지 확인할 수 있습니다.
해리포터 세계의 전체 지식 그래프도 포함하고 있는 github 저장소는 여기에서 확인하실 수 있습니다.
추신
harry_potter.graphml 파일을 Neo4J로 가져오려면 graphml 파일을 neo4j /import 폴더에 복사하고 Neo4J 브라우저에서 다음을 실행하세요.
source tutorial-env/bin/activate
위 내용은 지식 그래프로 해리포터의 세계 탐색하기의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

이 기사에서는 HTML을 구문 분석하기 위해 파이썬 라이브러리 인 아름다운 수프를 사용하는 방법을 설명합니다. 데이터 추출, 다양한 HTML 구조 및 오류 처리 및 대안 (SEL과 같은 Find (), find_all (), select () 및 get_text ()와 같은 일반적인 방법을 자세히 설명합니다.

Linux 터미널에서 Python 버전을 보려고 할 때 Linux 터미널에서 Python 버전을 볼 때 권한 문제에 대한 솔루션 ... Python을 입력하십시오 ...

Python의 통계 모듈은 강력한 데이터 통계 분석 기능을 제공하여 생물 통계 및 비즈니스 분석과 같은 데이터의 전반적인 특성을 빠르게 이해할 수 있도록 도와줍니다. 데이터 포인트를 하나씩 보는 대신 평균 또는 분산과 같은 통계를보고 무시할 수있는 원래 데이터에서 트렌드와 기능을 발견하고 대형 데이터 세트를보다 쉽고 효과적으로 비교하십시오. 이 튜토리얼은 평균을 계산하고 데이터 세트의 분산 정도를 측정하는 방법을 설명합니다. 달리 명시되지 않는 한,이 모듈의 모든 함수는 단순히 평균을 합산하는 대신 평균 () 함수의 계산을 지원합니다. 부동 소수점 번호도 사용할 수 있습니다. 무작위로 가져옵니다 수입 통계 Fracti에서

파이썬 객체의 직렬화 및 사막화는 사소한 프로그램의 주요 측면입니다. 무언가를 Python 파일에 저장하면 구성 파일을 읽거나 HTTP 요청에 응답하는 경우 객체 직렬화 및 사태화를 수행합니다. 어떤 의미에서, 직렬화와 사제화는 세계에서 가장 지루한 것들입니다. 이 모든 형식과 프로토콜에 대해 누가 걱정합니까? 일부 파이썬 객체를 지속하거나 스트리밍하여 나중에 완전히 검색하려고합니다. 이것은 세상을 개념적 차원에서 볼 수있는 좋은 방법입니다. 그러나 실제 수준에서 선택한 직렬화 체계, 형식 또는 프로토콜은 속도, 보안, 유지 보수 상태 및 프로그램의 기타 측면을 결정할 수 있습니다.

이 기사는 딥 러닝을 위해 텐서 플로와 Pytorch를 비교합니다. 데이터 준비, 모델 구축, 교육, 평가 및 배포와 관련된 단계에 대해 자세히 설명합니다. 프레임 워크, 특히 계산 포도와 관련하여 주요 차이점

이 튜토리얼은 간단한 나무 탐색을 넘어서 DOM 조작에 중점을 둔 아름다운 수프에 대한 이전 소개를 바탕으로합니다. HTML 구조를 수정하기위한 효율적인 검색 방법과 기술을 탐색하겠습니다. 일반적인 DOM 검색 방법 중 하나는 EX입니다

이 기사는 Numpy, Pandas, Matplotlib, Scikit-Learn, Tensorflow, Django, Flask 및 요청과 같은 인기있는 Python 라이브러리에 대해 설명하고 과학 컴퓨팅, 데이터 분석, 시각화, 기계 학습, 웹 개발 및 H에서의 사용에 대해 자세히 설명합니다.

이 기사는 Python 개발자가 CLIS (Command-Line Interfaces) 구축을 안내합니다. Typer, Click 및 Argparse와 같은 라이브러리를 사용하여 입력/출력 처리를 강조하고 CLI 유용성을 향상시키기 위해 사용자 친화적 인 디자인 패턴을 홍보하는 세부 정보.


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

Atom Editor Mac 버전 다운로드
가장 인기 있는 오픈 소스 편집기

DVWA
DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는

VSCode Windows 64비트 다운로드
Microsoft에서 출시한 강력한 무료 IDE 편집기

SecList
SecLists는 최고의 보안 테스터의 동반자입니다. 보안 평가 시 자주 사용되는 다양한 유형의 목록을 한 곳에 모아 놓은 것입니다. SecLists는 보안 테스터에게 필요할 수 있는 모든 목록을 편리하게 제공하여 보안 테스트를 더욱 효율적이고 생산적으로 만드는 데 도움이 됩니다. 목록 유형에는 사용자 이름, 비밀번호, URL, 퍼징 페이로드, 민감한 데이터 패턴, 웹 셸 등이 포함됩니다. 테스터는 이 저장소를 새로운 테스트 시스템으로 간단히 가져올 수 있으며 필요한 모든 유형의 목록에 액세스할 수 있습니다.

Eclipse용 SAP NetWeaver 서버 어댑터
Eclipse를 SAP NetWeaver 애플리케이션 서버와 통합합니다.
