ホームページ  >  記事  >  バックエンド開発  >  Python での簡単な統計の計算

Python での簡単な統計の計算

不言
不言転載
2019-01-14 10:21:045456ブラウズ

この記事の内容は Python での簡単な統計の計算に関するものですが、一定の参考値があり、困っている友人は参考にしていただければ幸いです。

1. これらの操作では、Anaconda 統合ライブラリがコンピューターにインストールされていることを確認する必要があります。インストール後にエラーが発生した場合は、元のコンピューターで Python をアンインストールし、Anaconda を再インストールできます。インストール時にインストールします。直接「環境変数の追加」にチェックを入れます。そうでない場合は、将来自分で環境変数を追加する必要があります。Pycharm のコンパイラーで、Anaconda インストール フォルダー内の python を選択します。データ ファイルを保存するために Pycharm に新しいデータ フォルダーを作成します。

Python での簡単な統計の計算

#2. Python コンソールを開きます。

3. まず Python を使用してデータを読み取ります。まず import pandas as pd と入力して pandas パッケージを導入し、次に df=pd.read_csv("./data/CityData.csv") と入力する必要があります。データを読み取り、最後に df と入力してデータを表示します。

Python での簡単な統計の計算

4. type(df) と type(df["cid"]) をそれぞれ入力すると、2 つのデータ型が異なることがわかります。

Python での簡単な統計の計算

Python での簡単な統計の計算5. 平均を計算します。 df.mean() または df["xid"].mean()

Python での簡単な統計の計算6. 中央値を計算します: df.median( ) またはdf["yid"].median


Python での簡単な統計の計算7. 四分位数を見つけます: df .quantile(q と入力します) =0.25)

Python での簡単な統計の計算

8. モードを検索します: df.mode() または df["xid"].mode( )

と入力します。

9. 標準偏差を求める: df.std() または df["yid"].std() と入力します

Python での簡単な統計の計算

10.分散の計算: df.var() または df["xid"].var()

Python での簡単な統計の計算

11. 合計: df.sum() またはdf["xid"].sum()

Python での簡単な統計の計算

12. スキュー係数を計算します: df.skew() または df[ "yid"] .skew()

Python での簡単な統計の計算

13. 尖度係数の計算: df.kurt() または df["yid"].kurt ()

Python での簡単な統計の計算

14. 正規分布関数を生成します。パンダは直接生成できません。最初に scipyimport scipy.stats を ss として導入し、次に ss を入力する必要があります。このとき生成されるのは正規分布オブジェクトです。ss.norm.stats(moments="mvsk")と入力して確認します。mvskはそれぞれ平均、分散、歪度係数、尖度係数を表します。

Python での簡単な統計の計算

現時点では、正規分布の mvsk に対応する 0、1、0、1、2 の 4 つの値が生成されていることがわかります。それぞれ0、0。

15.ss.norm.pdf(0.0)は横軸を0としたときの縦軸の値を表します。 ss.norm.ppf(0.9) は、負の無限大から戻り値まで累積したときに得られる値が 0.9 であることを意味します。ここで、ppf の後の値は 0 ~ 1 の間でなければなりません。 ss.norm.cdf(2)は負の無限大から2まで積分したときの戻り値を表しており、ss.norm.rvs(size=10)は正規分布に従う乱数を10個得ることができます。

Python での簡単な統計の計算

16.同様に、ss.chi2 と ss.t を入力すると、それぞれカイ二乗分布と T 分布を取得できます。

Python での簡単な統計の計算

17. さらに、サンプリングを実行することもできます。 df.sample(n=10) と入力して、データから 10 個のサンプルを抽出します。 df.sample(frac=0.1) はデータから 10% のサンプルを取得します。

Python での簡単な統計の計算

#

以上がPython での簡単な統計の計算の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事はsegmentfault.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。