ホームページ  >  記事  >  バックエンド開発  >  pandas で txt ファイルを読み取るためのクイック スタート ガイド

pandas で txt ファイルを読み取るためのクイック スタート ガイド

WBOY
WBOYオリジナル
2024-01-19 08:46:141327ブラウズ

pandas で txt ファイルを読み取るためのクイック スタート ガイド

Pandas は、データの読み取り、操作、分析に使用できるデータ処理ライブラリです。この記事では、Pandasを使ってtxtファイルを読み込む方法を紹介します。この記事は、Pandas を学習したい初心者を対象としています。

  1. Pandas ライブラリのインポート

まず、Python で Pandas ライブラリをインポートします。

import pandas as pd
  1. txt ファイルの読み取り

txt ファイルを読み取る前に、txt ファイルのいくつかの共通パラメータを理解する必要があります:

  • 区切り文字:区切り文字
  • header: ヘッダーの有無
  • names: ヘッダーがない場合は、列名を手動で指定できます
  • index_col: 特定の列をインデックスとして設定します列、デフォルトでは設定されていません
  • skiprows: 前の行数をスキップします
  • sep: 区切り文字を指定します

例: 「data」という名前のファイルがあるとします。 。TXT "。まず、read_table() 関数を使用して txt ファイルを読み取る必要があります。 read_table() は、テキスト データを読み取る非常に柔軟な方法を提供します。

data = pd.read_table('data.txt', delimiter=',', header=0)
  1. 読み取りデータの表示

.head() 関数を使用して、読み取られたデータの最初の数行を表示できます。デフォルトでは、データの最初の 5 行が表示されます。

print(data.head())
  1. データ クリーニング

データを読み取った後、必要なクリーニングと変換をデータに対して実行する必要があります。これには通常、不要な列の削除、欠損値の削除、列名の変更、データ型の変換などが含まれます。ここでは、一般的なデータ クリーニング方法をいくつか紹介します。

  • 不要な列の削除:
data = data.drop(columns=['ID'])
  • 欠損値の削除:
data.dropna(inplace=True)
  • 列名の変更:
data = data.rename(columns={'OldName': 'NewName'})
  • データ型の変換:
data['ColumnName'] = data['ColumnName'].astype(str)
data['ColumnName'] = data['ColumnName'].astype(int)
  1. データ分析

データ クリーニング後、データ処理分析を開始できます。 Pandas は、データを処理するための豊富なメソッドを提供します。

たとえば、特定の列の合計を計算するには:

total = data['ColumnName'].sum()
print(total)

Pandas では、groupby() 関数を使用してデータをグループ化できます。たとえば、データを名前でグループ化し、グループ化後の平均を計算したいとします。

grouped_data = data.groupby(['Name']).mean()
print(grouped_data.head())
  1. データの視覚化

最後に、データの視覚化を通じて、より多くのことを明確に行うことができます。データの傾向とパターンを理解します。

import matplotlib.pyplot as plt

plt.bar(data['ColumnName'], data['Count'])
plt.xlabel('ColumnName')
plt.ylabel('Count')
plt.title('ColumnName vs Count')
plt.show()

要約すると、Pandas はデータの読み取り、クリーニング、分析を行うための便利で高速な方法を提供します。この記事を通じて、読者は Pandas を使用して txt ファイルを読み取る方法と、データのクリーニング、分析、視覚化を実行する方法を学ぶことができます。

以上がpandas で txt ファイルを読み取るためのクイック スタート ガイドの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。