ホームページ  >  記事  >  バックエンド開発  >  pandas ライブラリでよく使用される関数のクイック スタート ガイド

pandas ライブラリでよく使用される関数のクイック スタート ガイド

WBOY
WBOYオリジナル
2024-01-24 08:05:05898ブラウズ

pandas ライブラリでよく使用される関数のクイック スタート ガイド

pandas ライブラリは、Python で一般的に使用されるデータ処理および分析ツールであり、データのインポート、クリーニング、処理、分析、視覚化を簡単に完了できる豊富な関数とメソッドを提供します。 。この記事では、pandas ライブラリでよく使用される関数のクイック スタート ガイドを、具体的なコード例とともに紹介します。

  1. データ インポート
    pandas ライブラリは、read_csv、read_excel、その他の関数を通じて、さまざまな形式のデータ ファイルを簡単にインポートできます。以下はサンプル コードです。
import pandas as pd

# 从csv文件中导入数据
data = pd.read_csv('data.csv')

# 从excel文件中导入数据
data = pd.read_excel('data.xlsx')
  1. データ表示
    pandas ライブラリには、データの最初と最後の数行を表示するための head、tail、およびその他の関数が用意されています。以下はサンプル コードです。
# 查看数据的前5行
print(data.head())

# 查看数据的后5行
print(data.tail())
  1. データ クリーニング
    pandas ライブラリには、欠損値を処理するための Dropna や fillna などの関数と、特定の値を置換するための replace などの関数が用意されています。価値観。以下はサンプル コードです。
# 删除含有缺失值的行
data = data.dropna()

# 使用均值填充缺失值
data = data.fillna(data.mean())

# 将特定的值替换为其他值
data['column_name'] = data['column_name'].replace('old_value', 'new_value')
  1. データのスライスとフィルタリング
    pandas ライブラリは、iloc や loc などの関数を通じてデータのスライスとフィルタリングを実装します。以下はサンプル コードです。
# 使用位置索引切片
subset = data.iloc[1:10, 2:5]

# 使用标签索引切片
subset = data.loc[data['column_name'] == 'value']

# 使用条件筛选
subset = data[data['column_name'] > 10]
  1. データの並べ替えとランキング
    pandas ライブラリは、データの並べ替えとランキング操作を実装するための sort_values や sort_index などの関数を提供します。以下はサンプル コードです。
# 按列进行排序
data = data.sort_values('column_name')

# 按索引进行排序
data = data.sort_index()

# 对列进行排名
data['column_rank'] = data['column_name'].rank()
  1. データの集計と計算
    pandas ライブラリには、データの集計と計算を実装するための groupby、agg、およびその他の関数が用意されています。以下はサンプル コードです。
# 对列进行聚合操作
grouped_data = data.groupby('column_name').sum()

# 对多列进行聚合操作
grouped_data = data.groupby(['column_name1', 'column_name2']).mean()

# 对列进行自定义的聚合操作
aggregated_data = data.groupby('column_name').agg({'column_name': 'mean', 'column_name2': 'sum'})
  1. データ視覚化
    pandas ライブラリは、データを視覚化するためのプロット関数を提供します。以下はサンプル コードです。
# 绘制折线图
data.plot(x='column_name', y='column_name2', kind='line')

# 绘制散点图
data.plot(x='column_name', y='column_name2', kind='scatter')

# 绘制柱状图
data.plot(x='column_name', y='column_name2', kind='bar')

この記事では、pandas ライブラリでよく使用されるいくつかの関数と、対応する特定のコード例を簡単に紹介します。これらの機能の使い方を学び使いこなすことで、より効率的にデータを処理・分析できるようになります。もちろん、pandas ライブラリには、誰もが見つけて適用できるようになる、より強力な機能があります。 pandas ライブラリについてさらに詳しく知りたい場合は、公式ドキュメントまたは関連するチュートリアルとサンプル コードをチェックしてください。

以上がpandas ライブラリでよく使用される関数のクイック スタート ガイドの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。