>기술 주변기기 >일체 포함 >Gradio and Easidocl이있는 DeepSeek-R1 데모 프로젝트

Gradio and Easidocl이있는 DeepSeek-R1 데모 프로젝트

尊渡假赌尊渡假赌尊渡假赌
尊渡假赌尊渡假赌尊渡假赌원래의
2025-03-01 10:19:09130검색

이 실습 가이드에서는 DeepSeek-R1 모델을 사용하여 Easyocr and Gradio와 통합 된 수학 퍼즐 솔버 어시스턴트를 구축합니다. DeepSeek R1 모델의 우수한 추론 기능을 사용하여 광범위한 수학 퍼즐을 해결하고 유용한 솔루션을 생성 할 수있는 기능적 웹 앱을 구축하는 방법을 단계별로 설명하겠습니다.

. DeepSeek-R1의 개요 만 받으려면이 DeepSeek-R1 개요를 확인하는 것이 좋습니다. 모델을 미세 조정하려면 미세 조정 DeepSeek-R1에 대한이 튜토리얼을 권장합니다. DeepSeek-R1 데모 프로젝트 : 개요 퍼즐 솔버 어시스턴트를 구축하려면 다음 단계를 살펴 보겠습니다.

필요한 전제 조건을 설정하십시오 최적화 된 구성으로 모델을 초기화합니다 모델의 지시 기능을 사용하여 핵심 기능을 정의합니다 쉽게 상호 작용하기 위해 구성 요소를 사용자 친화적 인 Gradio 인터페이스에 통합하십시오.

1 단계 : 전제 조건 구현에 뛰어 들기 전에 다음 도구와 라이브러리가 설치되어 있는지 확인해 보겠습니다.

파이썬 3.8 pytorch : 효율적인 딥 러닝 모델 처리 easyOcr : 이미지에서 텍스트를 추출하기위한 파이썬 모듈 Gradio : 사용자 친화적 인 웹 인터페이스를 만들려면

필요한 종속성을 설치하려면 다음 명령을 실행하십시오

위의 종속성이 설치되면 다음 가져 오기 명령을 실행하십시오.

2 단계 : DeepSeek-R1 API 설정 다음 스크립트는 DeepSeek API와 상호 작용하여 사용자 프롬프트를 기반으로 응답을 얻는 방법을 보여줍니다. DeepSeek의 API는 OpenAI의 형식과 호환되며 API 요청에 기본 URL을 사용합니다. 당신은 API 키를 직접 전달하거나 (개인 정보 보호 이유에 권장되지 않음), 나와 같은 Google Colab을 사용하는 경우 비밀 기능을 사용하여 API 키를 저장할 수 있습니다. 또는 환경 변수를 사용할 수 있습니다 이 기사를 게시 할 때 DeepSeek의 서비스는 무거운 짐을지고 있으며 성능이 저하되었습니다. 또한이 프로젝트의 코드를 실행하는 데 큰 어려움이있었습니다. 이 프로젝트에서 코드를 실행하기 전에 DeepSeek의 상태 페이지를 확인하십시오.
    3 단계 : 핵심 기능 설계 이제 API가 설정되었으므로 코드 기능을 작업 할 수 있습니다. 이 섹션에서는 논리 퍼즐이 포함 된 이미지를 처리하고 OCR을 사용하여 퍼즐 텍스트를 추출하고 텍스트를 개선 한 다음 DeepSeek API로 보내서 해결합니다. 먼저 코드를보고 설명하겠습니다.
  • <_> solve_puzzle () 함수는 로직 퍼즐이 포함 된 이미지를 처리하고 OCR 및 R1 모델을 사용하여 해결합니다. 다음 단계를 따릅니다
      초기화 EasyOcr : 우리는 EasyOcr Reader를 영어로 초기화하는 것으로 시작합니다. <:> 이미지 처리 : 업로드 된 이미지는 일시적으로 저장되고 Easyocr을 사용하여 텍스트를 추출합니다. 텍스트 개선 : 추출 된 텍스트는 일관성과 정확성을 보장하기 위해 표준화됩니다. 쿼리 구성 : 정제 된 퍼즐 텍스트 및 해결을위한 특정 지침을 포함하여 구조화 된 쿼리가 생성됩니다. API 상호 작용 : 쿼리는 DeepSeek API로 전송되어 퍼즐을 분석하고 해결합니다. DeepSeek-R1을 사용하려면 DeepSeek-Seasoner 모델을 사용하십시오. DeepSeek-V3을 사용하려면 DeepSeek-Chat을 사용하십시오. 그리고 항상 가격을 알고 있으므로 최신 정보에 대한 가격 책정 페이지를 확인하십시오. <: :> 응답 처리 : API 응답이 처리되어 솔루션 또는 적절한 오류 메시지를 추출하고 반환합니다. <:> 오류 처리 :이 기능은 시간 초과 또는 예기치 않은 예외와 같은 문제를 관리하여 강력한 작동을 보장합니다.
    1. 이 파이프 라인은 텍스트 추출을 위해 OCR과 지능형 퍼즐 해결을 위해 DeepSeek API를 결합합니다. 4 단계 : Gradio 인터페이스 생성 Gradio를 사용하면 응용 프로그램을위한 대화식 웹 인터페이스를 만들 수 있습니다. 다음 코드 Snippet은 Solve_Puzzle () 함수에 대한 사용자 친화적 인 Gradio 웹 인터페이스를 만듭니다. Gradio 인터페이스는 사용자의 입력을 가져 와서 유효성 검사를 위해 모델로 전달합니다.
    2. 위의 설정에는 세 가지 구성 요소가 포함되어 있습니다 :
    3. 입력 : 사용자가 이미지를 업로드 할 수있는 gr.image 구성 요소. 출력 : DeepSeek-R1의 답변을 표시하기위한 텍스트 구성 요소. 인터페이스 : Gr.interface () 함수는 입력과 출력을 함께 묶어 사용자 상호 작용을위한 웹 앱을 시작합니다.
    4. 5 단계 : 앱을 테스트하십시오 수학과 논리와 관련된 퍼즐로 앱을 테스트합시다. 첫 번째 행을 보면 1 4 = 5가 표시되며 이것이 간단한 추가라고 말할 수 있습니다. 그러나 두 번째 줄에는 2 5 = 12, 그리고 3 6 = 21이 있습니다. 패턴을 알아 내고 8 11 =?
    5. 를 해결할 수 있습니까? Gradio 인터페이스의 오른쪽을 보면 퍼즐 솔버 앱이 패턴을 식별했음을 알 수 있습니다.
    6. 결론 이 튜토리얼에서 우리는 수학 퍼즐을 해결하기 위해 OCR 및 Gradio와 결합 된 DeepSeek R1을 사용하여 수학 퍼즐 솔버 어시스턴트를 구축했습니다. AI의 최신 정보를 따라 잡으려면 다음 블로그를 추천합니다.
    7. Qwen 2.5-Max Deepseek의 Janus-Pro Deepseek Janus-Pro를 로컬로 사용하는 방법

위 내용은 Gradio and Easidocl이있는 DeepSeek-R1 데모 프로젝트의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.