從MySQL 表中檢索前N 個最大值
資料分析中的常見任務涉及選擇特定列的前N最大值從一張桌子上。考慮下表:
column1 | column2 |
---|---|
1 | foo |
2 | foo |
3 | foo |
4 | foo |
5 | bar |
6 | bar |
7 | bar |
8 | bar |
問題陳述:
對於給定的n 值,擷取第1 列的前n 個最大值,依第2 列分組。在上面的範例中,對於n=2,所需的輸出將為:
column1 |
---|
3 |
4 |
7 |
8 |
解:
雖然一個簡單的方法可能涉及按列對行進行分組2並為每個組選擇最大值,這只會傳回每個組的絕對最大值。要檢索前 n 個值,需要更進階的方法。
基於 UNION 的方法:
一種方法涉及使用 UNION 子句來組合多個查詢,每個查詢選擇不同群組的最大值。對於n=2,以下查詢就足夠了:
SELECT max(column1) m FROM table t GROUP BY column2 UNION SELECT max(column1) m FROM table t WHERE column1 NOT IN (SELECT max(column1) WHERE column2 = t.column2)
基於排名的方法:
對於更靈活的n 值,可以使用基於排名的方法受僱。這涉及到根據column1 的值為每行分配一個排名,然後選擇排名前n 的行。以下查詢實現了這種方法:
SELECT t.* FROM (SELECT grouper, (SELECT val FROM table li WHERE li.grouper = dlo.grouper ORDER BY li.grouper, li.val DESC LIMIT 2,1) AS mid FROM (SELECT DISTINCT grouper FROM table ) dlo ) lo, table t WHERE t.grouper = lo.grouper AND t.val > lo.mid
將 'grouper' 替換為分組依據列的名稱,將 'val' 替換為保存值的列。
LIMIT 子句定義每組的第 n 個排名值。然後選擇值大於第 n 個排名值的行。
結論:
兩種方法都提供了從表中選擇前n 個最大值的有效方法,每種方法有其自身的優勢和局限性。基於聯合的方法簡單而強大,而基於排名的方法在指定要檢索的最大值的數量方面提供了靈活性。
以上是如何從 MySQL 表中檢索按特定列分組的前 N 個最大值?的詳細內容。更多資訊請關注PHP中文網其他相關文章!