ホームページ >バックエンド開発 >Python チュートリアル >Pandas DataFrame でテキスト列を効率的に連結するにはどうすればよいですか?

Pandas DataFrame でテキスト列を効率的に連結するにはどうすればよいですか?

Mary-Kate Olsen
Mary-Kate Olsenオリジナル
2024-12-13 18:56:15533ブラウズ

How Can I Efficiently Concatenate Text Columns in a Pandas DataFrame?

Pandas DataFrame でテキスト列を連結する効率的な手法

データ操作の領域では、複数のテキスト列を 1 つのまとまりのある列に結合する必要がよくあります。 「年」列と「四半期」列を含むデータフレームを含む一般的なシナリオを検討してみましょう。目標は、結合された値を表す新しい「期間」列を作成することです。

これを達成するために、次の戦略を採用します。 :

直接連結 (文字列列)

両方の場合「年」列と「四半期」列は文字列型です。

df["period"] = df["Year"] + df["quarter"]

型変換 (非文字列列)

If を使用して直接連結できます。どちらの列も文字列型ではないため、最初にそれらを次のように変換する必要があります。文字列:

df["period"] = df["Year"].astype(str) + df["quarter"]

注意: 連結中は NaN を慎重に扱ってください。

複数の文字列列の集計

を扱うとき複数の文字列列の場合、「agg」を利用できます。 function:

df['period'] = df[['Year', 'quarter', ...]].agg('-'.join, axis=1)

ここで、「-」は列値の間の区切り文字として機能します。

これらのテクニックを採用することで、Pandas DataFrame 内のテキスト列を簡単に結合でき、シームレスなデータ処理と分析。

以上がPandas DataFrame でテキスト列を効率的に連結するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。