この記事は、Python の pandas でよく使われる関数をまとめたものです。一定の参考価値があります。困っている友達は参考にしてください。お役に立てれば幸いです。
pandas は Python のデータ処理ライブラリですが、これを使用する場合は import pandas as pd
と入力して導入する必要があります。
1.df = pd.read_csv("ファイルパス"): これは csv ファイルを読み取る方法です Excel などのドキュメントを読み取りたい場合は、対応する読み取り関数があります。
2.df.dtypes: ファイル内に文字データが存在する場合、オブジェクトが返されます。
3.df.head(n): データの最初の n 行を表示します。パラメータが渡されない場合、最初の 5 行が表示されます。データが表示されます。
4.df.tail(n): データの最後の n 行を表示します。パラメータが渡されない場合、データの最後の 5 行が表示されます。データが表示されます。
5.df.columns: データテーブルの列名をリスト形式で表示します。
6.df.shape: テーブル内のデータの行数と列数をタプルの形式で表示します。
7.df.loc[n]: インデックス値 n の行を返します。
8.df.loc[m][n]: インデックス値が m 行 n 列のデータを返します。
9.df.loc[m:n]: m から n までのインデックス値を持つ行を返します。
10.df.loc[[m,n,k]]: インデックス値がそれぞれ m,n,k である行を返します。
11.df["str"]: str という名前の列を返します。
12.df.columns.tolist(): 列名をリストに作成します。
13.df["str"]*df["str"]: 2 つの列の次元が同じであるため、対応する2 つの列の位置が乗算されます。
14.df.sort_values("str",inplace=True,ascending=False): str 列を降順に並べて取得します。データは元のデータを置き換えます。 inplace は、元のデータを並べ替えられたデータで置き換えるかどうかを示します。デフォルトは False で、置換しないことを意味します。 ascending は並べ替え順序を示します。デフォルトは True、つまり昇順に並べられます。
15.judge = pd.isnull(df["str"]): bool 値を返します。str 列のデータはnull 値。True を返し、それ以外の場合は False を返します。
16.a["judge"]: 不足しているデータである True として判定を返します。このとき、len() を呼び出します。欠損データの個数を知ることができます。
17.df.pivot_table(index="a",values= " b",aggfunc=np.mean): これは非常に重要な関数です。b を平均し、a のカテゴリに従って分類します。3 番目のパラメーターのデフォルトは Average です。
18.df.loc[n,"str"]: 行 n、列名 str のデータを見つけます。
19.sort_res.reset_index(drop=True): ソートしたデータの番号を並べ替えます ドロップとは、元のデータを破棄するかどうかを指します。実行結果を図 14 と比較すると、数値が並べ替えられていることがわかります。
20.df.apply(): これは、パンダでカスタム関数を使用する方法です。関数名は括弧内に渡されます。
以上がPythonのパンダでよく使われる関数のまとめの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。