에지 장치에서 자체 호스팅 래그 응용 프로그램-일체 포함-php.cn

집

기술 주변기기

일체 포함

에지 장치에서 자체 호스팅 래그 응용 프로그램

尊渡假赌尊渡假赌尊渡假赌

Apr 17, 2025 am 09:32 AM

라즈베리 파이에 강력한 AI 문서 프로세서 배포 : 단계별 가이드

이 기사에서는 Raspberry Pi를 지능형 문서 처리를위한 강력한 도구로 변환하여 Advanced AI의 힘을 활용하는 과정에 대해 자세히 설명합니다. 문서 수집 및 질문 응답 (QNA) 작업을 처리 할 수있는 시스템의 설정, 소프트웨어 설치 및 개발을 다룰 것입니다. 작은 장치조차도 올바른 접근 방식으로 인상적인 결과를 얻을 수 있습니다.

에지 장치에서 자체 호스팅 래그 응용 프로그램

학습 목표 :

헤드리스 작업을 위해 Raspberry Pi를 구성하십시오.
Ollama와 같은 종속성을 설치하고 관리합니다.
PDF 문서를로드 및 처리하기위한 시스템을 개발하십시오.
응답 쿼리를위한 검색 된 세대 생성 (RAG) 파이프 라인을 구축하십시오.
테스트 응용 프로그램 기능.
FastApi를 사용하여 응용 프로그램을 배포하고 Reflex로 사용자 인터페이스를 만듭니다.

(이 기사는 데이터 과학 블로그의 일부입니다.)

목차 :

소개
라즈베리 파이 설정
응용 프로그램 개발
- 1 단계 : 환경 구성
- 2 단계 : config.py 작성
- 3 단계 : 섭취 클래스
- 4 단계 : PDFLoader 클래스
- 5 단계 : QNA 파이프 라인
- 6 단계 : 래그 체인 쿼리
결론
자주 묻는 질문

라즈베리 파이 설정 :

Raspberry Pi의 운영 체제를 설정하여 시작하십시오. 이 예제에는 Ubuntu Server 24.04를 사용하지만 다른 배포판이 가능합니다. MicroSD 카드 (최소 16GB)가 필요합니다.

SD 카드 플래시 :

Raspberry Pi Imager를 다운로드하여 설치하십시오.
SD 카드를 선택하고 운영 체제로 Ubuntu Server 24.04를 선택하십시오.
SSH를 통해 헤드리스 작업을 구성하여 사용자 이름과 비밀번호를 제공합니다. 부팅시 자동 네트워크 연결을 위해 Wi-Fi 자격 증명을 추가하십시오.
서비스 탭에서 SSH를 활성화합니다.
SD 카드에 이미지를 작성하십시오.

에지 장치에서 자체 호스팅 래그 응용 프로그램

부팅 후 IP 주소를 사용하여 SSH를 통해 Raspberry Pi에 연결하십시오 (Fing과 같은 도구를 사용하여 찾으십시오) :

 ssh [username]@[IP 주소]

패키지 업데이트 :

시스템 패키지 업데이트 :

 Sudo 적절한 업데이트
Sudo 적절한 업그레이드

Ollama 설치 :

 curl -fssl https://ollama.com/install.sh | 쉿

(오류가 발생하면 Curl을 먼저 설치하십시오 : sudo apt install curl )

필요한 모델 다운로드 :

 Ollama Pull Phi3
Ollama는 nomic-embed-text를 끌어 당깁니다

응용 프로그램 개발 :

이제 헝겊 응용 프로그램을 구축합시다.

1 단계 : 환경 설정 :

가상 환경을 만들고 필요한 파이썬 패키지 (원본 기사에 나열)를 설치하십시오.

2 단계 : config.py 만들기 :

다음과 함께 config.py 파일을 만듭니다.

 language_model_name = "phi3"
embeddings_model_name = "nomic-embed-text"
Ollama_url = "http : // localhost : 11434"

(3-6 단계 섭취 클래스, pdfloader, QNA 파이프 라인 및 agg 체인 쿼리에 대한 자세한 내용은 원본 기사에 제공되며 여기에서 재현하기에는 너무 광범위합니다. 코드 스 니펫의 원본을 참조하십시오.)

결론:

이 안내서는 기능성 래그 애플리케이션을위한 Raspberry Pi를 설정하는 것을 보여줍니다. 다음 단계에는 응용 프로그램을 Fastapi로 포장하고 Reflex를 사용하여 사용자 인터페이스를 구축하는 것이 포함됩니다.

주요 테이크 아웃 :

RAG 애플리케이션을위한 Raspberry Pi 구성.
의존성 관리 (Ollama).
PDF 문서 수집 및 처리.
헝겊 파이프 라인 구현.
응용 프로그램 테스트 및 배포 준비.

자주 묻는 질문 :

(원래 기사의 FAQ도 여기에서 재현하기에는 너무 광범위합니다. 답변은 원본을 참조하십시오.)

(참고 : 이미지 URL은 변경되지 않았습니다.)

위 내용은 에지 장치에서 자체 호스팅 래그 응용 프로그램의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

관련 기사

Let 's Dance : 인간 신경 그물을 미세 조정하기위한 구조화 된 움직임Apr 27, 2025 am 11:09 AM

과학자들은 C. el 그러나 중요한 질문이 발생합니다. 새로운 AI S와 함께 효과적으로 작동하도록 우리 자신의 신경망을 어떻게 조정합니까?

새로운 Google 유출은 Gemini AI의 구독 변경을 보여줍니다Apr 27, 2025 am 11:08 AM

Google의 Gemini Advanced : 수평선의 새로운 가입 계층 현재 Gemini Advanced에 액세스하려면 $ 19.99/월 Google One AI Premium Plan이 필요합니다. 그러나 Android Authority 보고서는 다가오는 변경 사항을 암시합니다. 최신 Google p. 내 코드

데이터 분석 가속이 AI의 숨겨진 병목 현상을 해결하는 방법Apr 27, 2025 am 11:07 AM

고급 AI 기능을 둘러싼 과대 광고에도 불구하고 Enterprise AI 배포 내에서 상당한 도전 과제 : 데이터 처리 병목 현상. CEO는 AI 발전을 축하하는 동안 엔지니어는 느린 쿼리 시간, 과부하 파이프 라인,

Markitdown MCP는 모든 문서를 Markdowns로 변환 할 수 있습니다!Apr 27, 2025 am 09:47 AM

문서 처리는 더 이상 AI 프로젝트에서 파일을 여는 것이 아니라 혼돈을 명확하게 전환하는 것입니다. PDF, PowerPoint 및 Word와 같은 문서는 모든 모양과 크기로 워크 플로우를 범람합니다. 구조화 된 검색

빌딩 에이전트에 Google ADK를 사용하는 방법은 무엇입니까? - 분석 VidhyaApr 27, 2025 am 09:42 AM

Google의 에이전트 개발 키트 (ADK)의 전력을 활용하여 실제 기능을 갖춘 지능형 에이전트를 만듭니다! 이 튜토리얼은 Gemini 및 GPT와 같은 다양한 언어 모델을 지원하는 ADK를 사용하여 대화 에이전트를 구축하는 것을 안내합니다. w

효과적인 문제 해결을 위해 LLM을 통해 SLM 사용 - 분석 VidhyaApr 27, 2025 am 09:27 AM

요약: SLM (Small Language Model)은 효율성을 위해 설계되었습니다. 자원 결핍, 실시간 및 개인 정보 보호 환경에서 LLM (Large Language Model)보다 낫습니다. 초점 기반 작업, 특히 도메인 특이성, 제어 성 및 해석 성이 일반적인 지식이나 창의성보다 더 중요합니다. SLM은 LLM을 대체하지는 않지만 정밀, 속도 및 비용 효율성이 중요 할 때 이상적입니다. 기술은 더 적은 자원으로 더 많은 것을 달성하는 데 도움이됩니다. 그것은 항상 운전자가 아니라 프로모터였습니다. 증기 엔진 시대부터 인터넷 버블 시대에 이르기까지 기술의 힘은 문제를 해결하는 데 도움이되는 정도입니다. 인공 지능 (AI) 및보다 최근에 생성 AI가 예외는 아닙니다.