논문을 읽는 것은 우리의 일상 업무 중 하나라고 할 수 있습니다. 논문이 너무 많습니다. 어떻게 빨리 읽고 요약할 수 있을까요? ChatGPT가 등장한 이후 논문을 읽을 수 있는 서비스가 많이 생겼습니다. 실제로 ChatGPT API를 사용하는 것은 매우 간단하며 단 30줄의 Python 코드만으로 로컬에서 자체 애플리케이션을 구축할 수 있습니다.
논문을 읽는 것은 우리의 일상 업무 중 하나라고 할 수 있습니다. 논문이 너무 많습니다. 어떻게 빨리 읽고 요약할 수 있을까요? ChatGPT가 등장한 이후 논문을 읽을 수 있는 서비스가 많이 생겼습니다. 실제로 ChatGPT API를 사용하는 것은 매우 간단합니다. 단 30줄의 Python 코드로 로컬에서 자체 애플리케이션을 구축할 수 있습니다.
Python 및 ChatGPT API를 사용하여 논문을 요약하는 단계는 간단합니다.
import PyPDF2
import openai
pdf_summary_text = ""
parse pdf
pdf_file_path = "./pdfs/paper.pdf"
pdf_file = open(pdf_file_path, 'rb')
_reader = PyPDF2.PdfRead pdfer(pdf_file)
각 페이지의 텍스트 가져오기:
for page_num in range(len(pdf_reader.pages)):
page_text = pdf_reader.pages[page_num].extract_text().lower()
요약을 위해 openai의 API를 사용하세요
response = openai.ChatCompletion.create(
model="gpt-3.5-turbo",
messages=[
{"role": "system", "content": "당신은 유용한 연구 조교입니다."},
{ "role": "user", "content": f"요약: {page_text}"},
],
)
page_summary = response["choices"][0]["message"]["content" ]
병합 요약
pdf_summary_text += page_summary + "n"
pdf_summary_file = pdf_file_path.replace(os.path.splitext(pdf_file_path)[1], "_summary.txt")
with open(pdf_summary_file, "w+") as 파일:
file.write(pdf_summary_text)
완료, pdf 파일을 닫고 메모리를 재활용하세요
pdf_file.close()
전체 코드는 다음과 같습니다.
import os
import PyPDF2
import re
import openai
# 여기서는 Jupiter Notebook을 사용하고 있으며 URL
!curl -o paper.pdf https://arxiv.org/pdf/2301.00810v3.pdf?utm_source=pocket_saves
#에서 직접 논문을 다운로드한다고 가정합니다. 요약이 포함될 문자열
pdf_summary_text = ""
# PDF 파일 열기
pdf_file_path = "paper.pdf"
# PyPDF2를 사용하여 PDF 파일 읽기
pdf_file = open(pdf_file_path, 'rb')
pdf_reader = PyPDF2.PdfReader (pdf_file)
# PDF 파일의 모든 페이지를 반복
for page_num in range(len(pdf_reader.pages)):
# 페이지에서 텍스트 추출
page_text = pdf_reader.pages[page_num].extract_text(). lower()
response = openai.ChatCompletion.create(
model="gpt-3.5-turbo",
messages=[
{"role": "system", "content": "당신은 유용한 연구 조교입니다. "},
{"role": "user", "content": f"요약: {page_text}"},
],
)
page_summary = response["choices"][0]["message"] ["content "]
pdf_summary_text+=page_summary + "n"
pdf_summary_file = pdf_file_path.replace(os.path.splitext(pdf_file_path)[1], "_summary.txt")
open(pdf_summary_file, "w+")을 파일로 사용 :
file .write(pdf_summary_text)
pdf_file.close()
with open(pdf_summary_file, "r") as file:
print(file.read())
설명해야 할 두 가지 사항이 있습니다.
1. 무료 API 호출 제한이 있습니다. 이 방법의 비용은 논문당 약 0.2~0.5달러이며, 논문의 길이에 따라 다릅니다. 2. 저는 gpt4의 API를 테스트하지 않았습니다. 아직 신청하지도 않았고 가격에 따라 다릅니다. 너무 비싸고(20배 더 비쌉니다) 그만한 가치가 없다고 생각하지만, 논문의 그래프를 업로드하여 신청할 수 있는지 확인해 보세요. 더 나은 결과(확실하지 않음)
위 내용은 30줄의 Python 코드로 ChatGPT API를 호출하여 논문의 주요 내용을 요약할 수 있습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!