ホームページ >バックエンド開発 >Python チュートリアル >pandas を使用して txt ファイルを読み取るための実践的なヒント

pandas を使用して txt ファイルを読み取るための実践的なヒント

WBOY
WBOYオリジナル
2024-01-19 09:49:051027ブラウズ

pandas を使用して txt ファイルを読み取るための実践的なヒント

パンダを使用して txt ファイルを読み取るための実践的なヒント。具体的なコード例が必要です。

データ分析とデータ処理では、txt ファイルは一般的なデータ形式です。 pandas を使用して txt ファイルを読み取ると、高速で便利なデータ処理が可能になります。この記事では、パンダをより効果的に使用して txt ファイルを読み取るのに役立ついくつかの実践的なテクニックを、具体的なコード例とともに紹介します。

  1. 区切り文字を含む txt ファイルを読み取る

pandas を使用して区切り文字を含む txt ファイルを読み取る場合、read_csv 関数を使用し、delimiter パラメータを「区切り文字を指定する」(デフォルト) に設定できます。はカンマです)。以下は、タブ区切り文字を使用して txt ファイルを読み取るコード例です。

import pandas as pd

df = pd.read_csv('data.txt', delimiter='    ')
  1. 固定形式の txt ファイルの読み取り

If each columns of data in the txt file幅が固定されている場合は、read_fwf 関数を使用してファイルを読み取ることができます。固定形式の txt ファイルを読み取る場合は、colspecs パラメーターを使用してデータの各列の幅を指定する必要があります。以下は、固定形式の txt ファイルを読み取るコード例です。

import pandas as pd

colspecs = [(0,5),(5,10),(10,15),(15,20)]
df = pd.read_fwf('data.txt', colspecs=colspecs)
  1. ファイル ヘッダーまたは特定の行をスキップします

ファイル ヘッダーまたは特定の行が存在する可能性があります。 txt ファイル スキップする必要がある行は処理されません。 pandas を使用して txt ファイルを読み取る場合、パラメーター Skiprows を使用してスキップする行数を指定したり、パラメーター header を使用してファイル ヘッダーをスキップする必要があるかどうかを指定したりできます。以下は、ファイル ヘッダーをスキップするコード例です。

import pandas as pd

df = pd.read_csv('data.txt', delimiter='    ', header=1)
  1. カスタム列名

txt ファイルを読み取るとき、パンダはデータの最初の行を列名として解析します。 。 txt ファイルに列名がない場合、または列名をカスタマイズする必要がある場合は、パラメーター名を使用して列名を指定できます。以下はカスタム列名のコード例です。

import pandas as pd

df = pd.read_csv('data.txt', delimiter='    ', names=['name','age','gender'])
  1. 欠落データの処理

txt ファイルでは、データが欠落していることがよくあります。 Pandas は欠損データを処理するさまざまな方法を提供します。その中で最も一般的に使用されるのは、fillna 関数を使用して欠損データを埋めることです。以下は、欠損データを処理するためのコード例です。

import pandas as pd

df = pd.read_csv('data.txt', delimiter='    ')
df = df.fillna(0) # 将缺失数据填补为0

要約

上記は、pandas を使用して txt ファイルを読み取るための一般的な実践的なテクニックと、具体的なコード例を示しています。実際に使用する場合は、特定のデータ ファイルとニーズに基づいて適切な方法を選択する必要があります。 Pandas には非常に豊富な関数とパラメーターのセットが用意されており、これらのスキルを習得すると、データをより効率的に処理できるようになります。

以上がpandas を使用して txt ファイルを読み取るための実践的なヒントの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。