首页 >后端开发 >Python教程 >如何有效地选择 Pandas DataFrame 中的列?

如何有效地选择 Pandas DataFrame 中的列?

Mary-Kate Olsen
Mary-Kate Olsen原创
2024-12-08 12:35:12377浏览

How Do I Efficiently Select Columns in Pandas DataFrames?

在 Pandas Dataframes 中选择列

在处理数据操作任务时,选择特定列是必要的。在 Pandas 中,有多种选择列的选项。

选项 1:使用列名称

要按名称选择列,只需将列名称列表传递为如下:

df1 = df[['a', 'b']]

选项 2:使用数字索引

如果列索引已知,请使用 iloc 函数选择它们。请注意,Python 索引是从零开始的。

df1 = df.iloc[:, 0:2]  # Select columns with indices 0 and 1

替代选项:使用字典进行索引

对于列索引可能更改的情况,请使用以下方法:

column_dict = {df.columns.get_loc(c): c for idx, c in enumerate(df.columns)}
df1 = df.iloc[:, list(column_dict.keys())]

不推荐方法

不建议使用以下方法,因为它们可能会导致错误:

df1 = df['a':'b']  # Slicing column names does not work
df1 = df.ix[:, 'a':'b']  # Deprecated indexing method

保留原始数据

请注意,选择列仅创建对原始数据框的视图或引用。如果需要所选列的独立副本,请使用 copy() 方法:

df1 = df.iloc[:, 0:2].copy()

以上是如何有效地选择 Pandas DataFrame 中的列?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn