爆炸类似列表的列:扩展数据框指南
问题:
在Pandas 数据框,某些单元格可能包含多个值的列表。目标是转换数据框,使每个列表元素占据单独的行,同时保留其他列中的值。
解决方案:
方法 1: Repeat()
Pandas 0.25之前,常用repeat()方法进行爆炸list columns:
import pandas as pd import numpy as np df = pd.DataFrame( {'trial_num': [1, 2, 3, 1, 2, 3], 'subject': [1, 1, 1, 2, 2, 2], 'samples': [list(np.random.randn(3).round(2)) for i in range(6)] } ) # Expand 'samples' column into separate rows using repeat() df_exploded = df.assign( samples=df['samples'].str.join(',').str.split(',') ).explode('samples') df_exploded = df_exploded.reset_index(drop=True) # Add sample_num column to track list element order df_exploded['sample_num'] = df_exploded.groupby('trial_num').cumcount()
方法 2:explode() (Pandas >= 0.25)
随着 Pandas 0.25 的发布,.explode() 方法提供了一个优雅的解决方案:
df.explode('samples').reset_index(drop=True)
此方法自动处理空列表并保留 NaN,确保全面转换。
注意:
以上是如何有效地分解 Pandas DataFrame 中类似列表的列?的详细内容。更多信息请关注PHP中文网其他相关文章!