Heim >Backend-Entwicklung >Python-Tutorial >So führen Sie die Datenanalyse in Python mit der OpenAI -API durch

So führen Sie die Datenanalyse in Python mit der OpenAI -API durch

Jennifer Aniston
Jennifer AnistonOriginal
2025-02-10 12:21:10483Durchsuche

How to Perform Data Analysis in Python Using the OpenAI API

Kernpunkte

  • Mithilfe von Python- und OpenAI-APIs können Benutzer Datensätze systematisch auf wertvolle Erkenntnisse analysieren, ohne Code oder Zeitverschwendung zu überarbeiten, was eine universelle Lösung für die Datenanalyse liefert.
  • OpenAI -API und Python können verwendet werden, um Textdateien (z.
  • OpenAI -API und Python können auch CSV -Dateien (z. B. Datensatz mit mittlerem Artikel) analysieren, um den Gesamtton jedes Beitrags, die Hauptunterricht/Punkte und die "Klick -Köder -Score" von 0 bis 3 zu finden (0 bedeutet Klickköder klicken , 3 bedeutet extremer Klickköder).
  • Um mehrere Dateien automatisch zu analysieren, können Benutzer sie in einem Ordner platzieren, die GLOB -Bibliothek installieren und eine für Schleife verwenden, um den Inhalt jeder Datei zu lesen und die Ausgabe jeder Dateianalyse in einer separaten Datei mittel zu speichern.

Dieses Tutorial führt Sie bei der Verwendung von Python und OpenAI -API, um Daten abzubauen und zu analysieren.

Die manuelle Analyse von Datensätzen, um nützliche Daten zu extrahieren oder sogar die gleichen Vorgänge mit einem einfachen Programm auszuführen, kann häufig komplex und zeitaufwändig werden. Glücklicherweise können Datensätze mit der OpenAI-API und Python systematisch auf interessante Informationen analysiert werden, ohne dass Code und Zeitverschwendung übergreifend sind. Dies kann als universelle Lösung für die Datenanalyse verwendet werden, ohne dass verschiedene Methoden, Bibliotheken und APIs verwendet werden müssen, um verschiedene Arten von Daten und Datenpunkten in Datensätzen zu analysieren.

Lassen Sie uns Schritt für Schritt lernen, wie Sie Ihre Daten mithilfe von OpenAI -API und Python analysieren, wie Sie sie einrichten können.

Einstellungen

Um die OpenAI -API zu verwenden, um Daten über Python abzubauen und zu analysieren, installieren Sie die OpenAI- und Pandas -Bibliotheken:

<code class="language-bash">pip3 install openai pandas</code>

Erstellen Sie danach einen neuen Ordner und erstellen Sie eine leere Python -Datei im neuen Ordner.

Analysieren Sie Textdateien

In diesem Tutorial wäre es interessant, dass Python den neuesten Gewinnaufruf von Nvidia analysiert.

Laden Sie den neuesten NVIDIA -Ertragsanruf herunter, den ich vom Motley Fool erhalten habe, und bewegen Sie ihn in Ihren Projektordner.

Öffnen Sie dann Ihre leere Python -Datei und fügen Sie diesen Code hinzu.

Dieser Code liest den von Ihnen heruntergeladenen NVIDIA Financial Report Record und übergibt ihn als Transkriptvariable an die Funktion Extract_info.

extract_info-Funktion übergibt Eingabeaufforderungen und Datensätze als Benutzereingabe sowie Temperatur = 0,3 und model = "GPT-3,5-Turbo-16K". Der Grund, warum es das Modell "GPT-3,5-Turbo-16K" verwendet, ist, dass es großen Text wie diesen Datensatz verarbeiten kann. Dieser Code verwendet den Endpunkt der OpenAi.ChatCompletion.create, um die Antwort zu erhalten und die ProPT- und Transkript -Variablen als Benutzereingabe zu übergeben:

<code class="language-python">completions = openai.ChatCompletion.create(
    model="gpt-3.5-turbo-16k",
    messages=[
        {"role": "user", "content": prompt+"\n\n"+text}
    ],
    temperature=0.3,
)</code>

Die vollständige Eingabe sieht so aus:

<code>从文本中提取以下信息:
    英伟达的收入
    英伟达本季度做了什么
    关于人工智能的评论

英伟达财报记录在此处</code>

Wenn wir nun die Eingabe an die OpenAI.ChatCompletion.create -Endpunkt übergeben, sieht die vollständige Ausgabe so aus:

<code class="language-bash">pip3 install openai pandas</code>

Wie Sie sehen können, gibt es Textantworten sowie angeforderte Token -Nutzung zurück, was nützlich ist, wenn Sie Ausgaben und Optimierungskosten verfolgen. Da wir uns jedoch nur am Antworttext interessieren, erhalten wir ihn, indem wir die Vervollständigungen angeben.

Wenn Sie den Code ausführen, sollten Sie die Ausgabe ähneln wie unten:

Aus dem Text können wir die folgenden Informationen extrahieren:

    Der Umsatz von
  1. NVIDIA: Im zweiten Quartal des Geschäftsjahres 2024 erzielte NVIDIA einen Rekordumsatz im zweiten Quartal von 13,51 Mrd. USD, ein Anstieg von 88% monatlich und 101% gegenüber dem Vorjahr.
  2. Was Nvidia in diesem Quartal getan hat: Nvidia hat in allen Bereichen ein signifikantes Wachstum verzeichnet. Ihr Umsatz im Sektor des Rechenzentrums erreichte einen Rekord von 141% monatlich und 171% gegenüber dem Vorjahr. Ihre Gaming-Division erzielte ebenfalls ein Wachstum, wobei die Umsätze gegenüber dem Vorjahr um 11% und 22% gegenüber dem Vorjahr gestiegen sind. Darüber hinaus stieg der Umsatz ihrer professionellen Visualisierungsabteilung um 28% monatlich. Sie kündigten auch Partnerschaften und Partnerschaften mit Unternehmen wie Snowflake, Servicenow, Accenture, Umarmungsgesicht, VMware und SoftBank an.
  3. Kommentare zu KI: Nvidia hebt eine starke Nachfrage nach KI -Plattform und beschleunigte Computerlösungen hervor. Sie erwähnten die Bereitstellung wichtiger Cloud -Service -Anbieter und Internetunternehmen für Verbraucher in ihren HGX -Systemen. Sie diskutieren auch die Anwendung generativer künstlicher Intelligenz in verschiedenen Branchen wie Marketing, Medien und Unterhaltung. Nvidia betont das Potenzial generativer künstlicher Intelligenz, neue Marktchancen zu schaffen und die Produktivität in verschiedenen Sektoren zu verbessern.

Wie Sie sehen, extrahiert der Code die in der Eingabeaufforderung angegebenen Informationen (Nvidia -Umsatz, was Nvidia in diesem Quartal getan hat, und Kommentare zu künstlicher Intelligenz) und druckt ihn aus.

Analysieren Sie CSV -Dateien

Die Analyse des Ertragsaufrufs und der Textdateien ist cool. Um große Datenmengen systematisch zu analysieren, müssen Sie CSV -Dateien verwenden.

laden Sie diesen mittleren Artikel CSV -Datensatz als Beispiel herunter und fügen Sie ihn in Ihre Projektdatei ein.

Wenn Sie sich die CSV -Datei ansehen, werden Sie feststellen, dass Spalten wie Autor, Likes, Lesezeit, Link, Titel und Text enthält. Um Medienartikel mit OpenAI zu analysieren, benötigen Sie nur die Spalten "Titel" und "Text".

Erstellen Sie eine neue Python -Datei in Ihrem Projektordner und fügen Sie diesen Code ein.

Dieser Code unterscheidet sich geringfügig von dem Code, den wir zur Analyse von Textdateien verwenden. Es liest die CSV -Zeile für Zeile, extrahiert die angegebenen Informationen und fügt sie der neuen Spalte hinzu.

In diesem Tutorial habe ich einen CSV -Datensatz für den mittleren Artikel ausgewählt, den ich von Hsankesara auf Kaggle erhalten habe. Dieser CSV -Analysecode verwendet die Spalten der CSV -Datei "Titel" und "Artikel", um den Gesamtston- und Hauptunterricht/Punkte jedes Beitrags zu finden. Da ich immer auf Clickbait -Artikel auf Medium begegne, denke ich, dass jeder Artikel jeden Artikel angibt. interessant.

Die Analyse der gesamten CSV -Datei dauert zu lange und verbraucht zu viel API -Punkte, bevor ich den Code erkläre. In diesem Tutorial habe ich den Code die ersten fünf Artikel mit DF = DF [: 5] analysiert.

Sie können durch die folgenden Teile des Codes verwirrt sein. Lassen Sie mich also erklären:

<code class="language-bash">pip3 install openai pandas</code>

Dieser Code iteriert alle Artikel (Zeilen) in der CSV -Datei und erhält den Titel und den Körper jedes Artikels zu jeder Iteration und übergibt sie an die zuvor gesehene Extrakt_info -Funktion. Anschließend wird der folgende Code verwendet, um die Antwort der Funktion extract_info in eine Liste zu konvertieren, um verschiedene Informationsausschnitte mit diesem Code zu trennen:

<code class="language-python">completions = openai.ChatCompletion.create(
    model="gpt-3.5-turbo-16k",
    messages=[
        {"role": "user", "content": prompt+"\n\n"+text}
    ],
    temperature=0.3,
)</code>

Nächst

<code>从文本中提取以下信息:
    英伟达的收入
    英伟达本季度做了什么
    关于人工智能的评论

英伟达财报记录在此处</code>
Schließlich wird nach Abschluss der For -Loop die Liste mit den extrahierten Informationen in eine neue Spalte in der CSV -Datei eingefügt:

<code class="language-json">{
  "choices": [
    {
      "finish_reason": "stop",
      "index": 0,
      "message": {
        "content": "实际响应",
        "role": "assistant"
      }
    }
  ],
  "created": 1693336390,
  "id": "request-id",
  "model": "gpt-3.5-turbo-16k-0613",
  "object": "chat.completion",
  "usage": {
    "completion_tokens": 579,
    "prompt_tokens": 3615,
    "total_tokens": 4194
  }
}</code>
Wie Sie sehen können, fügt sie die Liste den neuen CSV -Spalten "Tone", "main_lesson_or_point" und "ClickBait_Score" hinzu.

Verwenden Sie dann Index = false, um sie an die CSV -Datei anzuhängen:

<code class="language-python">for di in range(len(df)):
    title = titles[di]
    abstract = articles[di]
    additional_params = extract_info('Title: '+str(title) + '\n\n' + 'Text: ' + str(abstract))
    try:
        result = additional_params.split("\n\n")
    except:
        result = {} </code>
Der Grund, warum index = false angegeben werden muss, besteht darin, jedes Mal, wenn eine neue Spalte an eine CSV -Datei angehängt wird, neue Indexspalten zu erstellen.

Wenn Sie nun eine Python -Datei ausführen, warten Sie, bis sie fertig ist, und überprüfen Sie unsere CSV -Datei im CSV -Datei Viewer, die neue Spalte wie im folgenden Bild gezeigt.

How to Perform Data Analysis in Python Using the OpenAI API

Wenn Sie den Code mehrmals ausführen, werden Sie feststellen, dass die generierten Antworten etwas unterschiedlich sind. Dies liegt daran, dass der Code Temperatur = 0,3 verwendet, um seinen Antworten Kreativität hinzuzufügen, was für subjektive Themen wie Clickbait sehr nützlich ist.

Verarbeitung mehrerer Dateien

Wenn Sie mehrere Dateien automatisch analysieren möchten, müssen Sie sie zunächst in einem Ordner befinden und sicherstellen, dass der Ordner nur Dateien enthält, an denen Sie interessiert sind, um zu verhindern, dass Ihr Python -Code irrelevante Dateien liest. Installieren Sie dann die Glob -Bibliothek mit PIP3 mit GLIB und importieren Sie sie mithilfe von Glob in Ihre Python -Datei.

Verwenden Sie in Ihrer Python -Datei diesen Code, um eine Liste aller Dateien im Datenordner zu erhalten:

<code class="language-python">try:
    result = additional_params.split("\n\n")
except:
    result = {} </code>
Geben Sie dann den Code ein, der die Analyse in die für Schleife ausführt:

<code class="language-python">try:
    apa1.append(result[0])
except Exception as e:
    apa1.append('No result')
try:
    apa2.append(result[1])
except Exception as e:
    apa2.append('No result')
try:
    apa3.append(result[2])
except Exception as e:
    apa3.append('No result')</code>
Lesen Sie in einer für Schleife den Inhalt jeder Datei der Textdatei wie folgt:

<code class="language-python">df = df.assign(Tone=apa1)
df = df.assign(Main_lesson_or_point=apa2)
df = df.assign(Clickbait_score=apa3)</code>
Für CSV -Dateien ist es auch so:

<code class="language-python">df.to_csv("data.csv", index=False)</code>
speichern Sie auch die Ausgabe jeder Dateianalyse in einer separaten Datei mit etwas ähnlichem wie folgt:

<code class="language-python">data_files = glob.glob("data_folder/*")</code>

Schlussfolgerung

Denken Sie daran, mit Ihren Temperaturparametern zu experimentieren und sie entsprechend Ihrem Anwendungsfall anzupassen. Wenn Sie möchten, dass KI kreativere Antworten generiert, erhöhen Sie den Temperaturwert.

Die Kombination aus OpenAI- und Python -Datenanalyse enthält viele Anwendungen zusätzlich zu den Aufzeichnungen der Artikel- und Finanzbericht -Aufzeichnungen. Zum Beispiel Nachrichtenanalyse, Buchanalyse, Kundenüberprüfungsanalyse usw.! Wenn Sie Ihren Python -Code auf großen Datensätzen testen, stellen Sie sicher, dass Sie ihn nur auf einem kleinen Teil des vollständigen Datensatzes testen, um API -Punkte und -zeit zu speichern.

häufig gestellte Fragen (FAQs) zu OpenAI -APIs für die Python -Datenanalyse

Was ist die OpenAI -API und wie funktioniert sie?

Die OpenAI -API ist ein leistungsstarkes Tool, mit dem Entwickler auf die Funktionen des OpenAI -Modells zugreifen und nutzen können. Es wird durchgeführt, indem eine Anfrage an den API -Endpunkt gesendet wird, der dann die Anforderung verarbeitet und die Ausgabe zurückgibt. APIs können für eine Vielzahl von Aufgaben verwendet werden, einschließlich der Textgenerierung, der Übersetzung, der Zusammenfassung und vieler mehr. Es ist so konzipiert, dass es einfach zu bedienen ist, mit einer einfachen Schnittstelle und einer klaren Dokumentation.

Wie verwende ich OpenAI -API für die Datenanalyse?

Die OpenAI -API ermöglicht die Datenanalyse, indem sie ihre Funktionen für maschinelles Lernen nutzen. Beispielsweise können Sie es verwenden, um Textdaten zu analysieren, Erkenntnisse zu extrahieren und Vorhersagen zu treffen. Sie können Ihre Daten verwenden, um eine Anfrage an die API zu senden, und sie werden die Analyseergebnisse zurückgeben. Dies kann mit Python erfolgen, da die API die Python -Integration unterstützt.

Welche Vorteile haben die Verwendung von OpenAI -API für die Datenanalyse?

Es gibt viele Vorteile der Verwendung von OpenAI -API für die Datenanalyse. Zunächst können Sie die Kraft des maschinellen Lernens nutzen, ohne Ihre eigenen Modelle bauen und trainieren zu müssen und Ihnen Zeit und Ressourcen zu sparen. Zweitens kann es große Datenmengen bewältigen und Erkenntnisse liefern, die möglicherweise schwer manuell zu erhalten. Schließlich ist es flexibel und kann in einer Vielzahl von Datenanalyseaufgaben verwendet werden.

Wie integriere ich OpenAI -API in Python?

Die Integration von OpenAI -API in Python ist sehr einfach. Sie müssen den OpenAI Python -Client installieren, der mit PIP durchgeführt werden kann. Sobald die Installation abgeschlossen ist, können Sie die OpenAI -Bibliothek in Ihr Python -Skript importieren und sie verwenden, um Anfragen an die API zu senden. Sie müssen auch Ihren API -Schlüssel einrichten, den Sie von der OpenAI -Website erhalten können.

Welche Aufgaben können mit der OpenAI -API erledigt werden?

Die OpenAI -API kann für verschiedene Aufgaben verwendet werden. Zum Beispiel kann es für die Textgenerierung verwendet werden, wodurch menschlicher Text basierend auf Eingabeaufforderungen erzeugt werden kann. Es kann auch in Übersetzung, Abstracts und Stimmungsanalyse verwendet werden. Im Zusammenhang mit der Datenanalyse kann es verwendet werden, um Textdaten zu analysieren, Erkenntnisse zu extrahieren und Vorhersagen zu treffen.

Was sind die Grenzen der Verwendung von OpenAI -API?

Während die OpenAI -API mächtig ist, hat sie einige Einschränkungen. Beispielsweise gibt es eine Begrenzung der Anzahl der Anfragen, die Sie an die API pro Minute senden können. Außerdem ist die API nicht kostenlos und die Kosten können zunehmen, wenn Sie an vielen Daten arbeiten. Obwohl die API normalerweise genau ist, ist sie nicht perfekt und die Ergebnisse sollten als Teil einer breiteren analytischen Strategie verwendet werden.

Wie kann ich mit OpenAI -API beheben?

Wenn Sie Probleme mit der OpenAI -API haben, können Sie einige Schritte unternehmen. Überprüfen Sie zunächst die Fehlermeldung, da sie normalerweise Hinweise auf die Ursache des Problems liefert. Sie können auch auf die API -Dokumentation verweisen, in der detaillierte Informationen zur Verwendung der API und zur Fehlerbehebung häufig gestellter Fragen enthalten sind. Wenn Sie weiterhin Probleme haben, können Sie sich an die OpenAI -Community wenden, um Hilfe zu erhalten.

Was ist die Sicherheitsstufe der OpenAI -API?

OpenAI -API wurde unter Berücksichtigung der Sicherheit entwickelt. Alle an die API gesendeten Daten sind während der Übertragung verschlüsselt, und OpenAI hat strenge Richtlinien zum Schutz Ihrer Daten. Wie bei jedem Online -Service ist es jedoch wichtig, die API verantwortungsbewusst zu nutzen und Best Practices der Datensicherheit zu befolgen.

Kann ich die OpenAI -API für den kommerziellen Gebrauch verwenden?

Ja, Sie können die OpenAI -API für kommerzielle Zwecke verwenden. Sie sollten jedoch wissen, dass die Verwendung der API Kosten entspricht und die Nutzungsbedingungen der API überprüfen sollten, um sicherzustellen, dass Ihre beabsichtigte Verwendung den Anforderungen entspricht.

Was ist die Zukunft der OpenAI -API?

Die Zukunft der OpenAI -API ist hell. OpenAI verbessert ständig seine Modelle und erweitert die Fähigkeiten der API. Mit der kontinuierlichen Entwicklung des maschinellen Lernens und der künstlichen Intelligenz können wir erwarten, dass APIs mächtiger und vielseitiger werden.

Das obige ist der detaillierte Inhalt vonSo führen Sie die Datenanalyse in Python mit der OpenAI -API durch. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn