ホームページ >バックエンド開発 >Python チュートリアル >Pandas DataFrame でテキスト列を効率的に連結するにはどうすればよいですか?
データ操作の領域では、複数のテキスト列を 1 つのまとまりのある列に結合する必要がよくあります。 「年」列と「四半期」列を含むデータフレームを含む一般的なシナリオを検討してみましょう。目標は、結合された値を表す新しい「期間」列を作成することです。
これを達成するために、次の戦略を採用します。 :
直接連結 (文字列列)
両方の場合「年」列と「四半期」列は文字列型です。
df["period"] = df["Year"] + df["quarter"]
型変換 (非文字列列)
If を使用して直接連結できます。どちらの列も文字列型ではないため、最初にそれらを次のように変換する必要があります。文字列:
df["period"] = df["Year"].astype(str) + df["quarter"]
注意: 連結中は NaN を慎重に扱ってください。
複数の文字列列の集計
を扱うとき複数の文字列列の場合、「agg」を利用できます。 function:
df['period'] = df[['Year', 'quarter', ...]].agg('-'.join, axis=1)
ここで、「-」は列値の間の区切り文字として機能します。
これらのテクニックを採用することで、Pandas DataFrame 内のテキスト列を簡単に結合でき、シームレスなデータ処理と分析。
以上がPandas DataFrame でテキスト列を効率的に連結するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。