ホームページ >バックエンド開発 >Python チュートリアル >Pandas を使用して列名を変更し、効率的なデータ処理を行う

Pandas を使用して列名を変更し、効率的なデータ処理を行う

王林
王林オリジナル
2024-01-11 17:14:06714ブラウズ

Pandas を使用して列名を変更し、効率的なデータ処理を行う

効率的なデータ処理: Pandas を使用して列名を変更するには、特定のコード例が必要です

データ処理は、データ分析およびデータ処理プロセスにおいて非常に重要なリンクです。多くの場合、データの列名の変更が必要になります。 Pandas は、データを迅速かつ効率的に処理するのに役立つ豊富なメソッドと関数を提供する強力なデータ処理ライブラリです。この記事では、Pandas を使用して列名を変更する方法を紹介し、具体的なコード例を示します。

実際のデータ分析では、元データの列名に命名基準が統一されていなかったり、わかりにくかったりする場合があり、必要に応じて列名を変更する必要があります。以下は、名前、年齢、性別の 3 つの列のデータを含むデータ セットの例です。

import pandas as pd

data = {'姓名': ['张三', '李四', '王五'],
        '年龄': [20, 25, 30],
        '性别': ['男', '女', '男']}

df = pd.DataFrame(data)
print(df)

出力結果は次のとおりです:

  姓名  年龄 性别
0  张三  20  男
1  李四  25  女
2  王五  30  男

次に、列名の中国語を英語に変更し、名前をnameに、年齢を年齢に、性別を性別に変更する必要があります。 。以下は、Pandas を使用して列名を変更する方法のコード例です:

df.rename(columns={'姓名': 'name', '年龄': 'age', '性别': 'gender'}, inplace=True)
print(df)

列名を変更した後の出力結果は次のとおりです:

  name  age gender
0   张三   20      男
1   李四   25      女
2   王五   30      男

上記のコードでは、 rename 関数を使用して列名を変更します。このうち、columnsパラメータは、変更が必要な列名を指定し、変更前後の対応関係を辞書形式で指定します。 inplace パラメータは、元のデータを変更するかどうかを指定するために使用されます。デフォルトは False で、変更された新しいデータのコピーを返すことを意味します。元のデータを変更する場合は、 、 True に設定します。

rename 関数を使用するほかに、columns 属性に値を割り当てて列名を直接変更することもできます。具体的なコード例を次に示します。

df.columns = ['name', 'age', 'gender']
print(df)

列名を変更した後の出力結果は上記のコードと同じになります。

上記の基本操作に加えて、Pandas では、バッチ変更に正規表現を使用したり、文字列置換に str メソッドを使用したりするなど、列名を変更するためのより高度なメソッドも提供しています。 。実際のデータ処理プロセスでは、さまざまなニーズに応じて適切な方法を選択して列名を変更できます。

要約すると、Pandas を使用して列名を変更するのは非常に簡単です。rename 関数を使用するか、columns に値を直接割り当てることで、データセットを簡単に変更できます。 属性。列名。実際のニーズに応じて、必要な結果を達成するためにさまざまな方法を選択できます。同時に、Pandas の他の関連データ処理方法に精通し、習得することで、データ分析においてデータをより効率的に操作できるようになります。

Pandas を使用して列名を変更するための具体的なコード例は上記のとおりです。この記事がデータ処理における Pandas の理解と使用に役立つことを願っています。

以上がPandas を使用して列名を変更し、効率的なデータ処理を行うの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。