在 Pandas Dataframes 中選擇列
在處理資料操作任務時,選擇特定列是必要的。在 Pandas 中,有多種選擇列的選項。
選項1:使用列名稱
要按名稱選擇列,只需將列名稱清單傳遞為如下:
df1 = df[['a', 'b']]
選項2:使用數字索引
如果欄位索引已知,請使用iloc函數選擇它們。請注意,Python 索引是從零開始的。
df1 = df.iloc[:, 0:2] # Select columns with indices 0 and 1
替代選項:使用字典進行索引
對於列索引可能變更的情況,請使用以下方法:
column_dict = {df.columns.get_loc(c): c for idx, c in enumerate(df.columns)} df1 = df.iloc[:, list(column_dict.keys())]
不建議方法
不建議使用以下方法,因為它們可能會導致錯誤:
df1 = df['a':'b'] # Slicing column names does not work df1 = df.ix[:, 'a':'b'] # Deprecated indexing method
保留原始資料
請注意,選擇列僅建立原始資料框的視圖或參考。如果需要所選列的獨立副本,請使用 copy() 方法:
df1 = df.iloc[:, 0:2].copy()
以上是如何有效地選擇 Pandas DataFrame 中的欄位?的詳細內容。更多資訊請關注PHP中文網其他相關文章!