pandas篩選資料的方法:1、導入Pandas庫;2、讀取資料;3、篩選資料;4、排序資料;5、分組聚合資料等。詳細介紹:1、導入Pandas庫,首先確保已安裝Pandas庫,如果沒有安裝,可以使用“pip install pandas”命令進行安裝,然後可以使用“import pandas as pd”命令導入Pandas庫;2、讀取數據,使用Pandas庫等等。
本教學作業系統:windows10系統、DELL G3電腦。
Pandas是一個流行的Python資料分析庫,它提供了許多強大的功能,使您能夠輕鬆篩選、處理和分析資料。以下是使用Pandas篩選資料的一些常見方法:
1、導入Pandas庫
首先,確保已安裝Pandas庫。如果沒有安裝,可以使用下列指令進行安裝:
pip install pandas
然後,匯入Pandas函式庫:
import pandas as pd
2、讀取資料
使用Pandas函式庫中的read_csv()函數讀取CSV文件,read_excel()函數讀取Excel文件等。例如,讀取名為data.csv的CSV檔案:
df = pd.read_csv('data.csv')
3、篩選資料
#Pandas提供了多種方法來篩選資料。以下是幾種常見的方法:
(1)基於條件篩選
使用loc和iloc屬性以及邏輯運算子(如&、|、~等)來篩選資料。例如,篩選年齡大於等於18歲且性別為女性的資料:
df.loc[(df['age'] >= 18) & (df['gender'] == 'female')]
(2)基於標籤篩選
使用loc屬性篩選特定標籤的資料。例如,篩選姓氏為「張」的資料:
df.loc[df['last_name'] == '张']
(3)以範圍篩選
#使用loc屬性來篩選特定範圍內的資料。例如,篩選年齡在18到30歲之間的資料:
df.loc[(df['age'] >= 18) & (df['age'] <= 30)]
(4)以多個條件篩選
使用query方法來篩選符合多個條件的資料。例如,篩選年齡大於等於18歲且性別為女性的資料:
df.query('age >= 18 & gender == "female"')
4、排序資料
使用sort_values()方法對資料進行排序。例如,按年齡升序排序:
df.sort_values('age', ascending=True)
5、分組聚合資料
使用groupby()方法將資料分組,並使用聚合函數(如sum()、mean()、count ()等)對每個組別進行計算。例如,計算每個性別組的平均年齡:
df.groupby('gender').mean()['age']
以上是pandas如何篩選數據的詳細內容。更多資訊請關注PHP中文網其他相關文章!