mysql踩坑之count distinct多列問題怎麼解決-mysql教程-PHP中文網

首頁

資料庫

mysql教程

mysql踩坑之count distinct多列問題怎麼解決

王林

Jun 03, 2023 am 10:49 AM

mysqlcountdistinct

復現的測試資料庫如下所示：

CREATE TABLE `test_distinct` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `a` varchar(50) CHARACTER SET utf8 DEFAULT NULL,
  `b` varchar(50) CHARACTER SET utf8 DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=latin1;

表內測試資料如下，現在我們需要統計這三列去重後的列的數量。

mysql踩坑之count distinct多列問題怎麼解決

問題分析

小夥伴給了我四個用來定位問題的查詢語句

SELECT COUNT(*) AS cnt FROM test_distinct;
SELECT COUNT(DISTINCT id, a, b) as cnt FROM test_distinct;
SELECT id, a, b, COUNT(*) AS cnt FROM test_distinct GROUP BY id, a, b HAVING cnt > 1;
SELECT 
	l.id AS l_id,
	l.a AS l_a,
	l.b AS l_b,
	r.id AS r_id,
	r.a AS r_a,
	r.b AS r_b
FROM test_distinct l LEFT JOIN test_distinct r
ON l.id = r.id AND l.a = r.a AND l.b = r.b
WHERE r.id is NULL or r.id = &#39;null&#39;;

查詢結果，如下所示：

mysql踩坑之count distinct多列問題怎麼解決

#注意！！！從測試資料很快就能大概猜出問題在哪，但原來表中資料是有3萬多條，無法用肉眼查看資料。

上面查詢結果違反直覺的點有兩個：

第二條去重統計後資料少了一條，但是，第三條資料的結果顯示並沒有相同的數據。
用同一張表做左外連接出現了驅動表有數據，而被驅動表為空的情況。

先看第二個問題，官方文件上有以下解釋：

在使用ON子句時，其所包含的條件表達式與WHERE子句中使用的相同。常見的情況是使用ON子句來指定表的連接條件，而使用WHERE子句對結果集中包含的行進行限制。
如果對於LEFT JOIN中ON或USING部分中的條件，則右表沒有符合的行，則右表使用所有欄位設定為NULL。
不能使用算術比較運算子（如=，）來比較NULL。

SELECT NULL = NULL;
SELECT NULL IS NULL;

mysql踩坑之count distinct多列問題怎麼解決

所以問題二在於NULL=NULL的結果永遠是False，也就導致兩行原本相等的數據結果卻不相等。

可是這並沒有解決第一個問題：為什麼去重後有資料消失了。但是，我們可以猜測消失的資料很有可能和NULL值有關係。

我們將count和distinct兩個動作分開：

SELECT COUNT(*) as cnt FROM (SELECT  DISTINCT id, a, b FROM test_distinct) as tmp;

mysql踩坑之count distinct多列問題怎麼解決

嗯？結果是正確的，那就說明count(distinct expr)產生的查詢計劃可能和我們想像的不一樣，並不是先去重再統計，使用explain分析一下兩條語句的查詢計劃，如下所示：

mysql踩坑之count distinct多列問題怎麼解決

從表中可以看到，mysql執行引擎直接將count(distinct expr)作為查詢，請查看官方文件：

mysql踩坑之count distinct多列問題怎麼解決

解決方案

至此問題才終於弄清楚了。解決這個問題的方法有兩種，第一種就是上述的先去重後統計，第二種可以利用IFNULL()函數:

SELECT COUNT(DISTINCT id, a, IFNULL(b, &#39;0&#39;)) as cnt FROM test_distinct;

另外補充一點，count( )嘚瑟使用：

SELECT id, a, b, COUNT(*) FROM test_distinct GROUP BY id, a, b;
SELECT id, a, b, COUNT(b) FROM test_distinct GROUP BY id, a, b;

mysql踩坑之count distinct多列問題怎麼解決

#知識點

不能使用算術比較運算符（如=，）來比較空值；
count(distinct expr)傳回expr列中不同的且非空的行數；
COUNT()有兩種截然不同的用途：它既可用於計算某個列值的數量，也可用於計算行數。在統計列值時要求列值是非空的（不統計NULL）。當在COUNT()函數的括號中指定了一個欄位或表達式時，函數會統計這個表達式中有值的結果數。 COUNT()的另一個作用是統計結果集的行數。當MySQL確認括號內的表達式值不可能為空時，實際上就是在統計行數。最簡單的就是當我們使用COUNT()的時候，這種情況下通配符並不像我們猜想的那樣擴展成所有的列，實際上，他會忽略所有列而直接統計所有的行數—— 《高效能MySQL》；
在InnoDB中，SELECT COUNT(*)和SELECT COUNT(1)處理方式一樣，沒有效能差異。

以上是mysql踩坑之count distinct多列問題怎麼解決的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文轉載於：亿速云。如有侵權，請聯絡admin@php.cn刪除

學習MySQL：新用戶的分步指南Apr 19, 2025 am 12:19 AM

MySQL值得學習，因為它是強大的開源數據庫管理系統，適用於數據存儲、管理和分析。 1）MySQL是關係型數據庫，使用SQL操作數據，適合結構化數據管理。 2）SQL語言是與MySQL交互的關鍵，支持CRUD操作。 3）MySQL的工作原理包括客戶端/服務器架構、存儲引擎和查詢優化器。 4）基本用法包括創建數據庫和表，高級用法涉及使用JOIN連接表。 5）常見錯誤包括語法錯誤和權限問題，調試技巧包括檢查語法和使用EXPLAIN命令。 6）性能優化涉及使用索引、優化SQL語句和定期維護數據庫。

MySQL：初學者的基本技能Apr 18, 2025 am 12:24 AM

MySQL適合初學者學習數據庫技能。 1.安裝MySQL服務器和客戶端工具。 2.理解基本SQL查詢，如SELECT。 3.掌握數據操作：創建表、插入、更新、刪除數據。 4.學習高級技巧：子查詢和窗口函數。 5.調試和優化：檢查語法、使用索引、避免SELECT*，並使用LIMIT。

MySQL：結構化數據和關係數據庫Apr 18, 2025 am 12:22 AM

MySQL通過表結構和SQL查詢高效管理結構化數據，並通過外鍵實現表間關係。 1.創建表時定義數據格式和類型。 2.使用外鍵建立表間關係。 3.通過索引和查詢優化提高性能。 4.定期備份和監控數據庫確保數據安全和性能優化。

MySQL：解釋的關鍵功能和功能Apr 18, 2025 am 12:17 AM

MySQL是一個開源的關係型數據庫管理系統，廣泛應用於Web開發。它的關鍵特性包括：1.支持多種存儲引擎，如InnoDB和MyISAM，適用於不同場景；2.提供主從復制功能，利於負載均衡和數據備份；3.通過查詢優化和索引使用提高查詢效率。

SQL的目的：與MySQL數據庫進行交互Apr 18, 2025 am 12:12 AM

SQL用於與MySQL數據庫交互，實現數據的增、刪、改、查及數據庫設計。 1）SQL通過SELECT、INSERT、UPDATE、DELETE語句進行數據操作；2）使用CREATE、ALTER、DROP語句進行數據庫設計和管理；3）複雜查詢和數據分析通過SQL實現，提升業務決策效率。

初學者的MySQL：開始數據庫管理Apr 18, 2025 am 12:10 AM

MySQL的基本操作包括創建數據庫、表格，及使用SQL進行數據的CRUD操作。 1.創建數據庫：CREATEDATABASEmy_first_db;2.創建表格：CREATETABLEbooks(idINTAUTO_INCREMENTPRIMARYKEY,titleVARCHAR(100)NOTNULL,authorVARCHAR(100)NOTNULL,published_yearINT);3.插入數據：INSERTINTObooks(title,author,published_year)VA