Heim >Backend-Entwicklung >Python-Tutorial >Berechnung einfacher Statistiken in Python

Berechnung einfacher Statistiken in Python

不言
不言nach vorne
2019-01-14 10:21:045539Durchsuche

Der Inhalt dieses Artikels befasst sich mit der Berechnung einfacher Statistiken in Python. Ich hoffe, dass er für Freunde hilfreich ist.

1. Stellen Sie für diese Vorgänge sicher, dass die integrierte Anaconda-Bibliothek auf dem Computer installiert ist. Wenn nach der Installation ein Fehler auftritt, können Sie Python auf dem ursprünglichen Computer deinstallieren und neu installieren Empfohlen während der Installation. Aktivieren Sie direkt die Option Umgebungsvariablen hinzufügen, andernfalls müssen Sie in Zukunft selbst Umgebungsvariablen hinzufügen. Wählen Sie im Compiler in Pycharm Python im Anaconda-Installationsordner aus. Erstellen Sie in Pycharm einen neuen Datenordner, um Datendateien zu speichern.

Berechnung einfacher Statistiken in Python

2. Öffnen Sie die Python-Konsole.

3. Verwenden Sie zuerst Python, um die Daten zu lesen. Sie müssen zuerst import pandas as pd eingeben, um das Pandas-Paket einzuführen, und dann df=pd.read_csv("./data/CityData.csv") eingeben Lesen Sie die Daten und geben Sie schließlich df ein, um die Daten anzuzeigen.

Berechnung einfacher Statistiken in Python

4. Geben Sie type(df) bzw. type(df["cid"]) ein, um festzustellen, dass die beiden Datentypen unterschiedlich sind. 5. Berechnen Sie den Durchschnitt : df.mean() oder df["xid"].mean()

Berechnung einfacher Statistiken in Python
6. Berechnen Sie den Median: Geben Sie df.median( ) ein. oder df["yid"].median

Berechnung einfacher Statistiken in Python

7. Quartile finden: Geben Sie df .quantile(q ein =0,25)Berechnung einfacher Statistiken in Python

8. Finden Sie den Modus: Geben Sie df.mode() oder df["xid"].mode( )
ein

9. Ermitteln Sie die Standardabweichung: Geben Sie df.std() oder df["yid"].std() ein

Berechnung einfacher Statistiken in Python

10. Varianz berechnen: df.var() oder df["xid"].var()

Berechnung einfacher Statistiken in Python

11 df["xid"].sum()

Berechnung einfacher Statistiken in Python

12. Berechnen Sie den Skew-Koeffizienten: df.skew() oder df[ "yid"] .skew()

Berechnung einfacher Statistiken in Python

13. Berechnen Sie den Kurtosis-Koeffizienten: df.kurt() oder df["yid"].kurt ()

Berechnung einfacher Statistiken in Python

14. Pandas kann sie nicht direkt generieren. Sie müssen zuerst sss eingeben und dann ss eingeben Was zu diesem Zeitpunkt generiert wird, ist ein normalverteiltes Objekt. Zur Überprüfung geben wir ss.norm.stats(moments="mvsk") ein.

Berechnung einfacher Statistiken in Python

Zu diesem Zeitpunkt können wir sehen, dass vier Werte generiert werden, die dem mvsk der Normalverteilung entsprechen, nämlich 0, 1, 0 bzw. 0.

15.ss.norm.pdf(0.0) stellt den Wert der Ordinate dar, wenn die Abszisse 0 ist. ss.norm.ppf(0.9) bedeutet, dass der Wert, der bei der Akkumulation von negativ unendlich bis zum Rückgabewert erhalten wird, 0,9 beträgt, wobei der Wert nach ppf zwischen 0 und 1 liegen muss. ss.norm.cdf(2) stellt den Rückgabewert bei der Integration von negativ Unendlich bis 2 dar, und ss.norm.rvs(size=10) kann 10 Zufallszahlen erhalten, die der Normalverteilung entsprechen.

Berechnung einfacher Statistiken in Python

16. Ebenso können wir ss.chi2 und ss.t eingeben, um die Chi-Quadrat-Verteilung bzw. die T-Verteilung zu erhalten.

Berechnung einfacher Statistiken in Python

17 Darüber hinaus können wir auch Stichproben durchführen. Geben Sie df.sample(n=10) ein, um 10 Stichproben aus den Daten zu extrahieren df. sample(frac=0,1) nimmt eine 10 %ige Stichprobe aus den Daten.

Berechnung einfacher Statistiken in Python

Das obige ist der detaillierte Inhalt vonBerechnung einfacher Statistiken in Python. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:segmentfault.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen