在 Pandas Dataframes 中选择列
在处理数据操作任务时,选择特定列是必要的。在 Pandas 中,有多种选择列的选项。
选项 1:使用列名称
要按名称选择列,只需将列名称列表传递为如下:
df1 = df[['a', 'b']]
选项 2:使用数字索引
如果列索引已知,请使用 iloc 函数选择它们。请注意,Python 索引是从零开始的。
df1 = df.iloc[:, 0:2] # Select columns with indices 0 and 1
替代选项:使用字典进行索引
对于列索引可能更改的情况,请使用以下方法:
column_dict = {df.columns.get_loc(c): c for idx, c in enumerate(df.columns)} df1 = df.iloc[:, list(column_dict.keys())]
不推荐方法
不建议使用以下方法,因为它们可能会导致错误:
df1 = df['a':'b'] # Slicing column names does not work df1 = df.ix[:, 'a':'b'] # Deprecated indexing method
保留原始数据
请注意,选择列仅创建对原始数据框的视图或引用。如果需要所选列的独立副本,请使用 copy() 方法:
df1 = df.iloc[:, 0:2].copy()
以上是如何有效地选择 Pandas DataFrame 中的列?的详细内容。更多信息请关注PHP中文网其他相关文章!