首頁 >後端開發 >php教程 >pandas取得groupby分組裡最大值所在的行方法

pandas取得groupby分組裡最大值所在的行方法

不言原創: 2018-04-20 13:38:464194瀏覽

以下為大家分享一篇pandas取得groupby分組裡最大值所在的行方法，具有很好的參考價值，希望對大家有幫助。一起來看看吧

pandas取得groupby分組裡最大值所在的行方法

如下面這個DataFrame,按照Mt分組，取出Count最大的那行

import pandas as pd
df = pd.DataFrame({&#39;Sp&#39;:[&#39;a&#39;,&#39;b&#39;,&#39;c&#39;,&#39;d&#39;,&#39;e&#39;,&#39;f&#39;], &#39;Mt&#39;:[&#39;s1&#39;, &#39;s1&#39;, &#39;s2&#39;,&#39;s2&#39;,&#39;s2&#39;,&#39;s3&#39;], &#39;Value&#39;:[1,2,3,4,5,6], &#39;Count&#39;:[3,2,5,10,10,6]})

df

CountMtSpValue0#3s1a1#12s1b225s234##56





		##c	3
10	s2	d	4
10	s2	e	##5

s3f6

#方法1：在分組中篩選出Count最大的行

#Count#ValueMts103#s1a1s2310s2d10


	Mt	Sp



##4		4

#6方法2：用transform取得原始dataframe的index，然後過濾出需要的行##

Mt
s1 3
s2 10
s3 6
Name: Count, dtype: int64
0 3
1 3
2 10
3 10
4 10
5 6
dtype: int64
0 True
1 False
2 False
3 True
4 True
5 True
dtype: bool

CountMt3##a 1310s2s2

			# print df.groupby(['Mt'])['Count'].agg(max) idx=df.groupby(['Mt'])['Count'].transform(max) print idx idx1 = idx == df['Count'] print idx1 df[idx1]

##Sp	Value		0
s1
##d	4	4	10

#上面的方法都有個問題是3、4行的值都是最大值，這樣回傳了多行，如果只要回傳一行呢？ ##MtSpValue03s1a1310#s2#d

方法3：idmax（舊版pandas是argmax）		# idx = df.groupby('Mt')['Count'].idxmax() print idx		df.iloc[idx] Mt s1 0 s2 3 s3 5 Name: Count, dtype: int64
			Count

##4

s3f

df.iloc[df.groupby([&#39;Mt&#39;]).apply(lambda x: x[&#39;Count&#39;].idxmax())]

#MtSpValue#031##d



		##s1	a
3	10	s2	##4

def using_apply(df):
 return (df.groupby(&#39;Mt&#39;).apply(lambda subf: subf[&#39;Value&#39;][subf[&#39;Count&#39;].idxmax()]))

def using_idxmax_loc(df):
 idx = df.groupby(&#39;Mt&#39;)[&#39;Count&#39;].idxmax()
 return df.loc[idx, [&#39;Mt&#39;, &#39;Value&#39;]]

print using_apply(df)

using_idxmax_loc(df)

Mt
s1 1
s2 4
s3 6
dtype: int64

##Mt#0




Value

#5##s3#

df.sort(&#39;Count&#39;, ascending=False).groupby(&#39;Mt&#39;, as_index=False).first()

#MtCount##MtCountSpValue0s1##3

6			方法4:先排好序，然後每組取第一個

s210

##d

6######f######6################################### ###那問題又來了，如果不是要取出最大值所在的行，例如要中間值所在的那行呢？ ######思路還是類似，可能具體寫法上要做一些修改，例如方法1和2要修改max演算法，方法3要自己實作一個回index的方法。不管怎樣，groupby之後，每個分組都是一個dataframe。 ######相關推薦：############pandas dataframe實作行列選擇與切片操作############Python 資料處理庫pandas 入門### #####################

以上是pandas取得groupby分組裡最大值所在的行方法的詳細內容。更多資訊請關注PHP中文網其他相關文章！

Python pandas count 切片 transform 算法

陳述：

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

上一篇：python3+PyQt5+Qt Designer實作擴充對話框下一篇：python3+PyQt5+Qt Designer實作擴充對話框

看更多