ホームページ >バックエンド開発 >Python チュートリアル >pandas DataFrame で列内のテキストを複数の行に分割するにはどうすればよいですか?

pandas DataFrame で列内のテキストを複数の行に分割するにはどうすればよいですか?

Barbara Streisand
Barbara Streisandオリジナル
2024-11-10 20:55:02359ブラウズ

How do you split text in a column into multiple rows in a pandas DataFrame?

列内のテキストを複数の行に分割する

大きな CSV ファイルでは、分析を容易にするために、列内のテキスト データを個別の行に分割する必要が生じることがよくあります。そしてデータ操作。 pandas または Python を使用する場合、この目的を達成するためにいくつかの方法を使用できます。

一般的なアプローチの 1 つは、目的の列で分割メソッドを利用して、指定された区切り文字に基づいてテキストを細分化することです。たとえば、「Seatblocks」という名前の列をスペースとコロンで分割するには、次の構文を使用できます:

s = df['Seatblocks'].str.split(' ').apply(Series, 1).stack()
s.index = s.index.droplevel(-1)  # align with df's index
s.name = 'Seatblocks'  # assign a name for joining

列を分割した後、join メソッドを使用して元の DataFrame に再結合できます。

del df['Seatblocks']
df.join(s)

あるいは、コロンで区切られた文字列ごとに個別の列を作成するには、次のコードを実行できます。適用:

df.join(s.apply(lambda x: Series(x.split(':'))))

これらのメソッドを採用することで、ユーザーはテキスト データを効果的に複数の行に分割でき、プログラミング作業においてより詳細な分析とデータ操作が可能になります。

以上がpandas DataFrame で列内のテキストを複数の行に分割するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。