ホームページ >バックエンド開発 >Python チュートリアル >Python Pandas をすぐに使い始めて、料理人のようにデータを処理する方法を学びましょう。

Python Pandas をすぐに使い始めて、料理人のようにデータを処理する方法を学びましょう。

WBOY
WBOY転載
2024-03-20 16:01:42604ブラウズ

Python Pandas 入门速成,庖丁解牛式数据处理!

pandas は、データ分析、クリーニング、変換に優れた強力な python データ処理ライブラリです。柔軟な データ構造 と豊富な機能により、データ処理のための強力なツールになります。

データ構造: データフレーム

DataFrame は Pandas の中核となるデータ構造で、テーブルに似ており、行と列で構成されます。各行はデータ レコードを表し、各列はレコードの属性を表します。

データのロードと読み取り

  • CSV ファイルからロード: pd.read_csv("filename.csv")
  • Excel ファイルからロード: pd.read_<strong class="keylink">excel</strong>("filename.xlsx")
  • JSON ファイルからロード: pd.read_<strong class="keylink">JSON</strong>("filename.<strong class="keylink">js</strong>on")

データクリーニング

  • 欠損値の処理: df.fillna(0)(欠損値を0で埋める)
  • 重複を削除: df.drop_duplicates()
  • 型変換: df["column"].astype(int) (列をオブジェクト型から整数型に変換します)

データ変換

  • データフレームのマージ: pd.merge(df1, df2, on="column_name")
  • データフレームの接続: pd.concat([df1, df2], axis=1)(列ごとに接続)
  • グループ操作: df.groupby("column_name").agg({"column_name": "mean"}) (列ごとにグループ化し、平均を計算します)
######データ分析######

記述統計:

    df.describe()
  • (平均、中央値、標準偏差などを計算します) 視覚化:
  • df.plot()
  • (棒グラフ、折れ線グラフなどを生成) データ集計:
  • df.agg({"column_name": "sum"})
  • (列の合計を計算します) ######高度な機能######
  • 条件付きフィルタリング:

df[df["column_name"] > 10]

    正規表現:
  • df[df["column_name"].str.contains("pattern")]
  • カスタム関数: df["new_column"] = df["old_column"].apply(my_funct<strong class="keylink">io</strong>n)
  • ######例###### パンダをPDとしてインポート # CSVファイルからデータをロード df = pd.read_csv("売上データ.csv") # クリーンデータ df.fillna(0, inplace=True) # 欠損値を埋める # データを変換する df["sale_date"] = pd.to_datetime(df["sale_date"]) # 日付列を日時型に変換します # データを分析する print(df.describe()) # 記述統計を表示する # データを視覚化する df.plot(x="sale_date", y="sales") # 折れ線グラフを生成します # データのエクスポート df.to_csv("sales_data_processed.csv",index=False) # CSV ファイルにエクスポート ######結論######

    Pandas はデータ処理を簡単にし、その強力な機能と柔軟なデータ構造により、データ サイエンティストやアナリストにとって必須の ツールとなっています。 Pandas の基本をマスターすると、複雑なデータセットを迅速かつ簡単に処理および分析できます。

以上がPython Pandas をすぐに使い始めて、料理人のようにデータを処理する方法を学びましょう。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事はlsjlt.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。