Heim >Backend-Entwicklung >Python-Tutorial >Wie erstelle ich ein kumulatives Kurvendiagramm in Python?
Das
ogive-Diagramm stellt grafisch die kumulative Verteilungsfunktion (CDF) eines Datensatzes dar, manchmal auch als kumulative Häufigkeitskurve bezeichnet. Es wird verwendet, um die Datenverteilung zu untersuchen und Muster und Trends zu entdecken. Matplotlib, Pandas und Numpy sind einige der von Python bereitgestellten Bibliotheken und Tools zum Erstellen von Otive-Grafiken. In diesem Tutorial schauen wir uns an, wie man Matplotlib zum Generieren von Ogive-Grafiken in Python verwendet.
Um ein kumulatives Kurvendiagramm zu erstellen, müssen wir die erforderlichen Bibliotheken importieren. In diesem Beispiel verwenden wir Matplotlib, Pandas und Numpy. Matplotlib ist eine beliebte Datenvisualisierungsbibliothek zum Erstellen interaktiver Diagramme und Grafiken in Python. Numpy hingegen wird zur Durchführung komplexer mathematischer Operationen verwendet. Pandas ist eine weitere weit verbreitete Python-Bibliothek, die auf Datenmanipulation und -analyse spezialisiert ist.
plt.plot(*np.histogram(data, bins), 'o-')
In dieser Syntax ist „Daten“ der Datensatz, der zum Erstellen des kumulativen Kurvendiagramms verwendet wird. Die Häufigkeitsverteilung der Daten wird durch die Funktion „np.histogram“ bestimmt, die auch die Werte und Bin-Grenzen des Histogramms zurückgibt. Verwenden Sie „plt.plot“, um ein kumulatives Kurvendiagramm zu erstellen. Verwenden Sie dazu die Formatzeichenfolge „o-“, um die Datenpunkte darzustellen und sie mit Linien zu verbinden. Der „*“-Operator übergibt dann die Histogrammwerte und Bin-Grenzen als separate Argumente an „plt.plot“.
Dies ist ein einfaches Beispiel, das ein Ogivendiagramm erstellt, um die kumulative Häufigkeitsverteilung einer Liste von Würfelwürfen zu visualisieren.
import numpy as np import matplotlib.pyplot as plt # List of dice rolls rolls = [1, 2, 3, 4, 5, 6, 3, 6, 2, 5, 1, 6, 4, 2, 3, 5, 1, 4, 6, 3] # Calculate the cumulative frequency bins = np.arange(0, 8, 1) freq, bins = np.histogram(rolls, bins=bins) cumulative_freq = np.cumsum(freq) # Create the ogive graph plt.plot(bins[1:], cumulative_freq, '-o') plt.xlabel('Dice Rolls') plt.ylabel('Cumulative Frequency') plt.title('Ogive Graph of Dice Rolls') plt.show()
Zuerst haben wir ein Ogive-Diagramm erstellt, um die kumulative Häufigkeitsverteilung einer Reihe von Würfelwürfen zu visualisieren, indem wir die erforderlichen Module NumPy und Matplotlib importierten. Anschließend definiert der Code eine Reihe von Würfelergebnissen und verwendet die Histogrammfunktion von NumPy, um ein „Histogramm“ der Daten zu erstellen, wobei die Anzahl der Gruppen und der Wertebereich der Daten angegeben werden. Als nächstes verwenden Sie die „Cumsum“-Funktion von NumPy, um die kumulative Häufigkeit der Daten darzustellen.
Verwenden Sie abschließend die Funktion „plot“ von Matplotlib, um die kumulativen Häufigkeiten als logarithmisches Diagramm darzustellen, wobei die Obergrenze jedes Abschnitts als x-Achse verwendet wird, wodurch ein Ogive-Diagramm entsteht. Das resultierende Ogive-Diagramm zeigt die kumulative Häufigkeitsverteilung von Würfelwürfen, wobei die x-Achse die gewürfelten Werte und die y-Achse die kumulative Häufigkeit dieser Werte bis zu einem bestimmten Punkt darstellt. Mithilfe dieser Grafik lässt sich die Häufigkeit und Verteilung von Würfelwürfen analysieren.
Dieses Beispiel zeigt ein Ogivendiagramm zur Visualisierung der Verteilung von 500 Zufallszahlen zwischen 0 und 100.
import numpy as np import matplotlib.pyplot as plt # Generate random data data = np.random.randint(0, 100, 500) # Calculate the cumulative frequency bins = np.arange(0, 110, 10) freq, bins = np.histogram(data, bins=bins) cumulative_freq = np.cumsum(freq) # Create the ogive graph plt.plot(bins[1:], cumulative_freq, '-o') plt.xlabel('Data') plt.ylabel('Cumulative Frequency') plt.title('Ogive Graph of Random Data') plt.show()
In diesem Beispiel verwenden wir zunächst NumPy, um einen Datensatz mit 500 Zufallszahlen zwischen 0 und 100 zu generieren. Verwenden Sie dann NumPy, um die kumulative Häufigkeit der Daten zu berechnen. Die Intervallbreite jeder Häufigkeit beträgt 10. Verwenden Sie abschließend Matplotlib, um die Beziehung zwischen der kumulativen Häufigkeit und der Obergrenze jedes Intervalls darzustellen und so ein Ogive-Diagramm zu erstellen. Dieses Beispiel zeigt, wie man mit Python und zufällig generierten Daten ein Ogivendiagramm erstellt.
Wir haben gelernt, mit dem Matplotlib-Modul kumulative Kurvendiagramme in Python zu erstellen. Dies ist ein einfacher Prozess unter Verwendung der Matplotlib-Bibliothek. Indem Sie Ihre Daten laden, kumulative Häufigkeiten berechnen und die Ergebnisse grafisch darstellen, können Sie die Verteilung Ihres Datensatzes leicht visualisieren und etwaige Muster oder Trends erkennen. Sie können Ihre Grafiken mit Beschriftungen, Titeln und Stilen anpassen, um sie optisch ansprechender und informativer zu gestalten. Kumulative Liniendiagramme sind nützliche Werkzeuge in der statistischen Analyse und können eine Vielzahl von Daten darstellen, von Einkommensverteilungen bis hin zu Testergebnissen.
Das obige ist der detaillierte Inhalt vonWie erstelle ich ein kumulatives Kurvendiagramm in Python?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!