지식 그래프로 해리포터의 세계 탐색하기-파이썬 튜토리얼-php.cn

집

백엔드 개발

파이썬 튜토리얼

지식 그래프로 해리포터의 세계 탐색하기

Susan Sarandon

Dec 22, 2024 am 12:13 AM

목표

해리포터 세계에 관한 모든 것을 손끝에서 보고 싶은 해리포터 팬이신가요? 아니면 단순히 해리포터의 다양한 캐릭터가 어떻게 결합되는지에 대한 멋진 차트로 친구들에게 깊은 인상을 남기고 싶으신가요? 지식 그래프만 보면 됩니다.

이 가이드는 노트북과 좋아하는 책만으로 Neo4J에서 지식 그래프를 얻는 방법을 보여줍니다.

지식그래프란 무엇인가

Wikipedia에 따르면:

지식 그래프는 그래프 구조의 데이터 모델이나 토폴로지를 이용해 데이터를 표현하고 연산하는 지식 베이스입니다.

뭐가 필요하세요

하드웨어 측면에서 필요한 것은 컴퓨터뿐입니다. 가급적 Nvidia 그래픽 카드가 장착된 컴퓨터가 좋습니다. 완전히 자급자족하기 위해 로컬 LLM 설정을 사용하겠지만 동일한 목적으로 OpenAI API를 쉽게 사용할 수도 있습니다.

설정 단계

다음이 필요합니다:

Ollama와 여러분이 가장 좋아하는 LLM 모델
파이썬 환경
Neo4J

올라마

WSL2에서 Ubuntu 24.04로 코딩하면서 GPU 작업 부하를 쉽게 통과시키기 위해 Ollama docker를 사용하고 있습니다. Ollama를 Docker 컨테이너로 실행하는 것은 먼저 Nvidia 컨테이너 툴킷을 설치한 후 다음을 수행하는 것만큼 간단합니다.

docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

Nvidia GPU가 없는 경우 CLI에서 다음 명령을 사용하여 CPU 전용 Ollama를 실행할 수 있습니다.

docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

완료되면 좋아하는 LLM 모델을 Ollama로 가져올 수 있습니다. Ollama에서 사용 가능한 모델 목록은 여기에서 확인하세요. 예를 들어 qwen2.5를 가져오려면 CLI에서 다음 명령을 실행할 수 있습니다.

docker exec -it ollama ollama run qwen2.5

Ollama가 끝났습니다!

Python 환경

먼저 Python 가상 환경을 생성하여 설치한 패키지나 구성 변경 사항을 전역적으로 적용하는 대신 환경 내에서만 제한하도록 할 것입니다. 다음 명령은 가상 환경 harry-potter-rag를 생성합니다:

python -m venv harry-potter-rag

그런 다음 다음 명령을 사용하여 가상 환경을 활성화할 수 있습니다.

source tutorial-env/bin/activate

다음으로 pip를 사용하여 주로 LangChain에서 관련 패키지를 설치합니다.

%pip install --upgrade --quiet  langchain langchain-community langchain-openai langchain-experimental neo4j

Neo4J 설정

Neo4J를 도커 컨테이너로 설정하겠습니다. 특정 구성을 쉽게 설정할 수 있도록 docker compose를 사용합니다. 다음을 docker-compose.yaml이라는 파일에 복사한 다음 동일한 디렉터리에서 docker-compose up -d를 실행하여 Neo4J를 설정할 수 있습니다.

이 설정은 또한 데이터, 로그 및 플러그인이 로컬 폴더(예: /data)에 유지되도록 보장합니다. /로그 및 플러그인.

docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

지식 그래프 구축

이제 Jupyter Notebook에서 지식 그래프 구축을 시작할 수 있습니다! 먼저 다음을 사용하여 Ollama LLM 인스턴스를 설정했습니다.

docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

다음으로 LLM을 Neo4J에 연결합니다.

docker exec -it ollama ollama run qwen2.5

이제 좋아하는 해리포터 텍스트나 좋아하는 책을 선택하고 LangChain을 사용하여 텍스트를 덩어리로 분할할 차례입니다. 청킹은 긴 텍스트를 여러 부분으로 나누는 전략이며, 그런 다음 각 부분을 LLM으로 보내 이를 노드와 에지로 변환하고 각 청크의 노드와 에지를 Neo4J에 삽입할 수 있습니다. 간단한 입문서입니다. 노드는 그래프에 표시되는 원이며 각 가장자리는 두 개의 노드를 함께 연결합니다.

코드는 청크가 어떻게 생겼는지 빠르게 미리 볼 수 있도록 첫 번째 청크도 인쇄합니다.

python -m venv harry-potter-rag

이제 GPU가 무거운 작업을 수행하고 텍스트를 지식 그래프로 변환할 때입니다! 책 전체를 자세히 살펴보기 전에 LLM이 원하는 방식으로 그래프를 반환하도록 더 나은 안내를 제공하는 프롬프트를 실험해 보겠습니다.

프롬프트는 기본적으로 우리가 기대하는 것의 예이거나 응답에 표시하려는 내용에 대한 지침입니다. 지식 그래프의 맥락에서 우리는 LLM에게 사람과 조직만 노드로 추출하고 엔터티가 제공된 특정 유형의 관계만 허용하도록 지시할 수 있습니다. 예를 들어, 배우자 관계는 개인과 조직 사이가 아닌 개인과 개인 사이에서만 이루어지도록 허용할 수 있습니다.

이제 첫 번째 텍스트 덩어리에 LLMGraphTransformer를 사용하여 그래프가 어떻게 나타나는지 확인할 수 있습니다. 결과가 마음에 들 때까지 프롬프트를 조정할 수 있는 좋은 기회입니다.

다음 예에서는 개인 또는 조직이 될 수 있는 노드를 예상하며 allowed_relationships는 허용되는 관계 유형을 지정합니다. LLM이 원본 텍스트의 다양성을 캡처할 수 있도록 strict_mode도 False로 설정하여 아래에 정의되지 않은 다른 관계나 엔터티도 캡처할 수 있습니다. 대신 strict_mode를 True로 설정하면 허용되는 항목을 준수하지 않는 엔터티 및 관계가 삭제되거나 허용되는 항목으로 강제 실행될 수 있습니다(정확하지 않을 수 있음).

source tutorial-env/bin/activate

프롬프트를 미세 조정한 후 만족스러우면 이제 지식 정보를 수집할 차례입니다. try - Except는 Neo4J에 제대로 삽입될 수 없는 모든 응답을 명시적으로 처리하는 것입니다. 코드는 모든 오류가 기록되도록 설계되었지만 후속 청크를 그래프로 변환하면서 루프가 계속 진행되는 것을 차단하지 않습니다. 🎜>

docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

위 루프에서는 해리포터와 마법사의 돌, 해리포터와 비밀의 방, 해리포터와 아즈카반의 죄수를 섭취하는 데 약 46분이 걸렸습니다. 결국 4868개의 고유 노드가 생겼습니다! 아래에서 빠른 미리보기를 볼 수 있습니다. 그래프가 정말 붐비고, 누가 누구와 어떤 방식으로 관련되어 있는지 구분하기 어려운 것을 볼 수 있습니다.

Navigating the world of Harry Potter with Knowledge Graphs

이제 암호 쿼리를 활용하여 Dumbledore를 살펴볼 수 있습니다!

docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

Navigating the world of Harry Potter with Knowledge Graphs

자, 이제 덤블도어 본인만 알겠습니다. 해리포터와 어떤 연관이 있는지 알아보겠습니다.

docker exec -it ollama ollama run qwen2.5

Navigating the world of Harry Potter with Knowledge Graphs

자, 이제 우리는 해리와 덤블도어가 말한 내용에 관심이 있습니다.

python -m venv harry-potter-rag

Navigating the world of Harry Potter with Knowledge Graphs

우리가 찾고 있는 것을 실제로 찾기 위해 거쳐야 할 문서가 많아 그래프가 여전히 매우 혼란스럽다는 것을 알 수 있습니다. 문서를 노드로 모델링하는 것이 이상적이지 않다는 것을 알 수 있으며 그래프를 보다 직관적으로 사용하기 위해 LLMGraphTransformer에서 추가 작업을 수행할 수 있습니다.

결론

인터넷에 연결하지 않고도 로컬 컴퓨터에 지식 정보를 설정하는 것이 얼마나 쉬운지 확인할 수 있습니다.

해리포터 세계의 전체 지식 그래프도 포함하고 있는 github 저장소는 여기에서 확인하실 수 있습니다.

추신

harry_potter.graphml 파일을 Neo4J로 가져오려면 graphml 파일을 neo4j /import 폴더에 복사하고 Neo4J 브라우저에서 다음을 실행하세요.

source tutorial-env/bin/activate

위 내용은 지식 그래프로 해리포터의 세계 탐색하기의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

관련 기사

목록과 배열 사이의 요소 별 작동의 성능 차이를 설명하십시오.May 06, 2025 am 12:15 AM

ArraysareBetterForElement-WiseOperationsDuetOfasterAcccessandoptimizedimmentations.1) ArraysHaveCecontIguousMemoryFordirectAccess, 향상

Numpy 배열 전체에서 수학적 작업을 어떻게 효율적으로 수행 할 수 있습니까?May 06, 2025 am 12:15 AM

Numpy에서 전체 배열의 수학적 작업은 벡터화 된 작업을 통해 효율적으로 구현 될 수 있습니다. 1) 추가 (ARR 2)와 같은 간단한 연산자를 사용하여 배열에서 작업을 수행하십시오. 2) Numpy는 기본 C 언어 라이브러리를 사용하여 컴퓨팅 속도를 향상시킵니다. 3) 곱셈, 분할 및 지수와 같은 복잡한 작업을 수행 할 수 있습니다. 4) 배열 모양이 호환되도록 방송 작업에주의를 기울이십시오. 5) NP.Sum ()과 같은 Numpy 함수를 사용하면 성능을 크게 향상시킬 수 있습니다.

요소를 파이썬 어레이에 어떻게 삽입합니까?May 06, 2025 am 12:14 AM

Python에는 요소를 목록에 삽입하는 두 가지 주요 방법이 있습니다. 1) 삽입 (인덱스, 값) 메소드를 사용하여 지정된 인덱스에 요소를 삽입 할 수 있지만 큰 목록의 시작 부분에서 삽입하는 것은 비효율적입니다. 2) Append (value) 메소드를 사용하여 목록 끝에 요소를 추가하여 매우 효율적입니다. 대형 목록의 경우 Append ()를 사용하거나 Deque 또는 Numpy Array를 사용하여 성능을 최적화하는 것이 좋습니다.

유닉스와 창 모두에서 파이썬 스크립트 실행 파일을 어떻게 만들 수 있습니까?May 06, 2025 am 12:13 AM

TomakeApythonscriptexecutableonBothunixandwindows : 1) addashebangline (#!/usr/bin/envpython3) andusechmod xtomakeitexecutableonix.2) onwindows, inristpythonisinstalledandassociatedwith.pybattfile (run.bat) torunthescrest.

스크립트를 실행하려고 할 때 '명령되지 않은'오류가 발생하는지 확인해야합니까?May 06, 2025 am 12:03 AM

"CommandNotFound"오류가 발생하면 다음 사항을 확인해야합니다. 1. 스크립트가 존재하고 경로가 올바른지 확인하십시오. 2. 파일 권한을 확인하고 CHMOD를 사용하여 필요한 경우 실행 권한을 추가하십시오. 3. 스크립트 인터프리터가 설치되었는지 확인하십시오. 4. 스크립트 시작시 셰 잔 라인이 올바른지 확인하십시오. 그렇게하면 스크립트 작업 문제를 효과적으로 해결하고 코딩 프로세스가 원활하게 보장 할 수 있습니다.

배열이 숫자 데이터를 저장하는 목록보다 일반적으로 더 메모리 효율적인 이유는 무엇입니까?May 05, 2025 am 12:15 AM

ArraysareGenerallyMorememory- 효율적 인 thanlistsortingnumericaldataduetotheirfixed-sizenatureanddirectmemoryAccess.1) ArraysStoreElementsInacontiguousBlock, retoneverHead-fompointerSormetAdata.2) 목록, 종종 implementededymamamicArraysorlinkedStruct

파이썬 목록을 파이썬 어레이로 어떻게 변환 할 수 있습니까?May 05, 2025 am 12:10 AM

ToconvertapyThonlisttoAnarray, usethearraymodule : 1) importThearrayModule, 2) CreateAlist, 3) Usearray (typecode, list) toconvertit, thetypecodelike'i'forintegers

동일한 Python 목록에 다른 데이터 유형을 저장할 수 있습니까? 예를 들어보세요.May 05, 2025 am 12:10 AM

Python 목록은 다양한 유형의 데이터를 저장할 수 있습니다. 예제 목록에는 정수, 문자열, 부동 소수점 번호, 부울, 중첩 목록 및 사전이 포함되어 있습니다. 목록 유연성은 데이터 처리 및 프로토 타이핑에서 가치가 있지만 코드의 가독성과 유지 관리를 보장하기 위해주의해서 사용해야합니다.

See all articles

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

PhpStorm 맥 버전

최신(2018.2.1) 전문 PHP 통합 개발 도구

에디트플러스 중국어 크랙 버전

작은 크기, 구문 강조, 코드 프롬프트 기능을 지원하지 않음

ZendStudio 13.5.1 맥

강력한 PHP 통합 개발 환경

Dreamweaver Mac版

시각적 웹 개발 도구

MinGW - Windows용 미니멀리스트 GNU

이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.