Heim >Technologie-Peripheriegeräte >KI >30 Zeilen Python-Code können die ChatGPT-API aufrufen, um den Hauptinhalt des Papiers zusammenzufassen

30 Zeilen Python-Code können die ChatGPT-API aufrufen, um den Hauptinhalt des Papiers zusammenzufassen

PHPz
PHPznach vorne
2023-04-04 12:05:061145Durchsuche

Das Lesen von Aufsätzen gehört zu unseren täglichen Aufgaben. Es gibt zu viele Aufsätze. Wie können wir sie schnell lesen und zusammenfassen? Seit dem Aufkommen von ChatGPT stehen viele Dienste zum Lesen von Artikeln zur Verfügung. Tatsächlich ist die Verwendung der ChatGPT-API sehr einfach. Wir können unsere eigene Anwendung lokal mit nur 30 Zeilen Python-Code erstellen.

Das Lesen von Aufsätzen gehört zu unseren täglichen Aufgaben. Es gibt zu viele Aufsätze. Wie können wir sie schnell lesen und zusammenfassen? Seit dem Aufkommen von ChatGPT stehen viele Dienste zum Lesen von Artikeln zur Verfügung. Tatsächlich ist die Verwendung der ChatGPT-API sehr einfach. Wir können unsere eigene Anwendung lokal mit nur 30 Zeilen Python-Code erstellen.

30 Zeilen Python-Code können die ChatGPT-API aufrufen, um den Hauptinhalt des Papiers zusammenzufassen

Die Schritte zum Zusammenfassen des Papiers mit Python und der ChatGPT-API sind einfach:

  • PyPDF2 für die PDF-Verarbeitung und OpenAI für die Schnittstelle mit GPT-3.5-turbo.
  • Verwenden Sie PyPDF2, um PDF-Dateien zu öffnen und zu lesen.
  • Durchsuchen Sie jede Seite im PDF-Dokument und extrahieren Sie Text.
  • Verwenden Sie GPT-3.5-turbo, um Zusammenfassungen für den Text jeder Seite zu erstellen.
  • Zusammenfassungen zusammenführen und den endgültigen Zusammenfassungstext in einer Datei speichern. PyPDF2 importieren
Erhalten Sie den Text jeder Seite:


für page_num in range(len(pdf_reader.pages)):
page_text = pdf_reader.pages[page_num].extract_text().lower()

Verwenden Sie die API von openai für die Zusammenfassung

Antwort = openai.ChatCompletion.create(
model="gpt-3.5-turbo",
messages=[{"role": "system", "content": "Sie sind ein hilfreicher Forschungsassistent."},

{ „role“: „user“, „content“: f „Zusammenfassen: {page_text}“},

],

)
page_summary = Response[“choices“][0][“message“][“content“ ]

Zusammenfassung zusammenführen

pdf_summary_text += page_summary + „n“
pdf_summary_file = pdf_file_path.replace(os.path.splitext(pdf_file_path)[1], „_summary.txt“)
mit open(pdf_summary_file, „w+“) as Datei:
file.write(pdf_summary_text)

Fertig, schließen Sie die PDF-Datei und recyceln Sie den Speicher

pdf_file.close()

Der vollständige Code lautet wie folgt:

import os
import PyPDF2
import re
import openai

# Hier gehe ich davon aus, dass Sie sich auf einem Jupiter-Notizbuch befinden und das Papier direkt von der URL herunterladen

!curl -o paper.pdf https://arxiv.org/pdf/2301.00810v3.pdf?utm_source=pocket_saves

# Stellen Sie die ein Zeichenfolge, die die Zusammenfassung enthält: pdf_summary_text = "" (pdf_file)

# Alle Seiten in der PDF-Datei durchlaufen

für page_num in range(len(pdf_reader.pages)):

# Extrahieren Sie den Text aus der Seite
page_text = pdf_reader.pages[page_num].extract_text(). Lower()

response = openai.ChatCompletion.create(
model="gpt-3.5-turbo",
messages=[
{"role": "system", "content": "Sie sind ein hilfreicher Forschungsassistent. "},
{"role": "user", "content": f"Zusammenfassen: {page_text}"},
],
)
page_summary = Response["choices"][0]["message"] ["content"]
pdf_summary_text+=page_summary + "n"
pdf_summary_file = pdf_file_path.replace(os.path.splitext(pdf_file_path)[1], "_summary.txt")
mit open(pdf_summary_file, "w+") als Datei :
file .write(pdf_summary_text)

pdf_file.close()

mit open(pdf_summary_file, "r") als Datei:
print(file.read())

Es gibt zwei Dinge, die erklärt werden müssen:

1. Das Limit für den kostenlosen API-Aufruf ist begrenzt und kostet etwa 0,2 bis 0,5 US-Dollar, was je nach Länge des Papiers variiert. 2. Ich habe die API von gpt4 nicht getestet Ich habe mich noch nicht dafür beworben, und es hängt vom Preis ab. Es ist zu teuer (20-mal teurer) und ich glaube nicht, dass es sich lohnt, aber Sie können versuchen, die Diagramme des Papiers hochzuladen, um zu sehen, ob dies der Fall ist bessere Ergebnisse (nicht sicher)

Das obige ist der detaillierte Inhalt von30 Zeilen Python-Code können die ChatGPT-API aufrufen, um den Hauptinhalt des Papiers zusammenzufassen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:51cto.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen