Pandas 密集排名:為並列值分配唯一排名
在資料分析中,通常需要根據順序對資料集中的值進行排名。在 Pandas 中,rank 函數預設提供了一種計算序數排名的方法。但是,有時需要獲得密集排名,其中並列值獲得相同的排名,而不是被跳過。
考慮以下 Pandas 資料框:
<code>Year Value 2012 10 2013 20 2013 25 2014 30</code>
要對 Year 欄位產生等效於 DENSE_RANK() 函數的結果,請依照下列步驟進行:
<code>df['Rank'] = df.Year.rank(method='dense').astype(int) print(df)</code>
這將產生一個名為 Rank 的新列,其中為每個年份分配密集排名:
<code> Year Value Rank 0 2012 10 1 1 2013 20 2 2 2013 25 2 3 2014 30 3</code>
在此範例中,2013 年的並列值獲得相同的排名 2,確保沒有值被跳過或排名錯誤。 astype(int) 轉換是可選的,但建議使用它來確保排名儲存為整數。
以上是Pandas `rank(method='dense')` 如何為綁定值分配唯一的排名?的詳細內容。更多資訊請關注PHP中文網其他相關文章!