>기술 주변기기 >일체 포함 >30줄의 Python 코드로 ChatGPT API를 호출하여 논문의 주요 내용을 요약할 수 있습니다.

30줄의 Python 코드로 ChatGPT API를 호출하여 논문의 주요 내용을 요약할 수 있습니다.

PHPz
PHPz앞으로
2023-04-04 12:05:061145검색

논문을 읽는 것은 우리의 일상 업무 중 하나라고 할 수 있습니다. 논문이 너무 많습니다. 어떻게 빨리 읽고 요약할 수 있을까요? ChatGPT가 등장한 이후 논문을 읽을 수 있는 서비스가 많이 생겼습니다. 실제로 ChatGPT API를 사용하는 것은 매우 간단하며 단 30줄의 Python 코드만으로 로컬에서 자체 애플리케이션을 구축할 수 있습니다.

논문을 읽는 것은 우리의 일상 업무 중 하나라고 할 수 있습니다. 논문이 너무 많습니다. 어떻게 빨리 읽고 요약할 수 있을까요? ChatGPT가 등장한 이후 논문을 읽을 수 있는 서비스가 많이 생겼습니다. 실제로 ChatGPT API를 사용하는 것은 매우 간단합니다. 단 30줄의 Python 코드로 로컬에서 자체 애플리케이션을 구축할 수 있습니다.

30줄의 Python 코드로 ChatGPT API를 호출하여 논문의 주요 내용을 요약할 수 있습니다.

Python 및 ChatGPT API를 사용하여 논문을 요약하는 단계는 간단합니다.

  • PDF 처리용 PyPDF2 및 GPT-3.5-turbo와의 인터페이스용 OpenAI입니다.
  • PyPDF2를 사용하여 PDF 파일을 열고 읽으세요.
  • PDF 문서의 각 페이지를 탐색하고 텍스트를 추출하세요.
  • GPT-3.5-turbo를 사용하여 각 페이지의 텍스트에 대한 스니펫을 생성하세요.
  • 요약을 병합하고 최종 요약 텍스트를 파일에 저장하세요.

import PyPDF2
import openai
pdf_summary_text = ""

parse pdf

pdf_file_path = "./pdfs/paper.pdf"
pdf_file = open(pdf_file_path, 'rb')
_reader = PyPDF2.PdfRead pdfer(pdf_file)

각 페이지의 텍스트 가져오기:

for page_num in range(len(pdf_reader.pages)):
page_text = pdf_reader.pages[page_num].extract_text().lower()

요약을 위해 openai의 API를 사용하세요

response = openai.ChatCompletion.create(
model="gpt-3.5-turbo",
messages=[
{"role": "system", "content": "당신은 유용한 연구 조교입니다."},
{ "role": "user", "content": f"요약: {page_text}"},
],
)
page_summary = response["choices"][0]["message"]["content" ]

병합 요약

pdf_summary_text += page_summary + "n"
pdf_summary_file = pdf_file_path.replace(os.path.splitext(pdf_file_path)[1], "_summary.txt")
with open(pdf_summary_file, "w+") as 파일:
file.write(pdf_summary_text)

완료, pdf 파일을 닫고 메모리를 재활용하세요

pdf_file.close()

전체 코드는 다음과 같습니다.

import os
import PyPDF2
import re
import openai

# 여기서는 Jupiter Notebook을 사용하고 있으며 URL
!curl -o paper.pdf https://arxiv.org/pdf/2301.00810v3.pdf?utm_source=pocket_saves

#에서 직접 논문을 다운로드한다고 가정합니다. 요약이 포함될 문자열
pdf_summary_text = ""
# PDF 파일 열기
pdf_file_path = "paper.pdf"
# PyPDF2를 사용하여 PDF 파일 읽기
pdf_file = open(pdf_file_path, 'rb')
pdf_reader = PyPDF2.PdfReader (pdf_file)
# PDF 파일의 모든 페이지를 반복
for page_num in range(len(pdf_reader.pages)):
# 페이지에서 텍스트 추출
page_text = pdf_reader.pages[page_num].extract_text(). lower()

response = openai.ChatCompletion.create(
model="gpt-3.5-turbo",
messages=[
{"role": "system", "content": "당신은 유용한 연구 조교입니다. "},
{"role": "user", "content": f"요약: {page_text}"},
],
)
page_summary = response["choices"][0]["message"] ["content "]
pdf_summary_text+=page_summary + "n"
pdf_summary_file = pdf_file_path.replace(os.path.splitext(pdf_file_path)[1], "_summary.txt")
open(pdf_summary_file, "w+")을 파일로 사용 :
file .write(pdf_summary_text)

pdf_file.close()

with open(pdf_summary_file, "r") as file:
print(file.read())

설명해야 할 두 가지 사항이 있습니다.

1. 무료 API 호출 제한이 있습니다. 이 방법의 비용은 논문당 약 0.2~0.5달러이며, 논문의 길이에 따라 다릅니다. 2. 저는 gpt4의 API를 테스트하지 않았습니다. 아직 신청하지도 않았고 가격에 따라 다릅니다. 너무 비싸고(20배 더 비쌉니다) 그만한 가치가 없다고 생각하지만, 논문의 그래프를 업로드하여 신청할 수 있는지 확인해 보세요. 더 나은 결과(확실하지 않음)

위 내용은 30줄의 Python 코드로 ChatGPT API를 호출하여 논문의 주요 내용을 요약할 수 있습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제