mysql에서 고유한 여러 열 개수 문제를 해결하는 방법-MySQL 튜토리얼-php.cn

집

데이터 베이스

MySQL 튜토리얼

mysql에서 고유한 여러 열 개수 문제를 해결하는 방법

王林

Jun 03, 2023 am 10:49 AM

mysqlcountdistinct

재현된 테스트 데이터베이스는 다음과 같습니다.

CREATE TABLE `test_distinct` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `a` varchar(50) CHARACTER SET utf8 DEFAULT NULL,
  `b` varchar(50) CHARACTER SET utf8 DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=latin1;

테이블의 테스트 데이터는 다음과 같습니다. 이제 이 세 개의 열을 중복 제거한 후 열 수를 계산해야 합니다.

mysql에서 고유한 여러 열 개수 문제를 해결하는 방법

문제 분석

친구가 문제를 찾기 위해 4개의 쿼리문을 주었습니다

SELECT COUNT(*) AS cnt FROM test_distinct;
SELECT COUNT(DISTINCT id, a, b) as cnt FROM test_distinct;
SELECT id, a, b, COUNT(*) AS cnt FROM test_distinct GROUP BY id, a, b HAVING cnt > 1;
SELECT 
	l.id AS l_id,
	l.a AS l_a,
	l.b AS l_b,
	r.id AS r_id,
	r.a AS r_a,
	r.b AS r_b
FROM test_distinct l LEFT JOIN test_distinct r
ON l.id = r.id AND l.a = r.a AND l.b = r.b
WHERE r.id is NULL or r.id = &#39;null&#39;;

쿼리 결과는 다음과 같습니다.

mysql에서 고유한 여러 열 개수 문제를 해결하는 방법

주의! ! ! 테스트 데이터를 보면 어디에 문제가 있는지 금방 짐작할 수 있지만, 테이블 안에는 30,000개가 넘는 데이터가 있어 육안으로는 그 데이터를 보는 것이 불가능하다는 사실이 밝혀진다.

위 쿼리 결과에는 두 가지 반직관적인 점이 있습니다.

중복 제거 통계 후 두 번째 데이터가 누락되었지만 세 번째 데이터 결과를 보면 동일한 데이터가 없는 것으로 나타났습니다.
동일 테이블을 사용하여 왼쪽 외부 연결을 할 때 구동 테이블에는 데이터가 있지만 피동 테이블은 비어 있습니다.

먼저 두 번째 질문을 살펴보겠습니다. 공식 문서에는 다음과 같은 설명이 있습니다.

ON 절을 사용할 때 포함된 조건식은 WHERE 절에서 사용된 것과 동일합니다. 일반적인 상황은 ON 절을 사용하여 테이블의 조인 조건을 지정하고 WHERE 절을 사용하여 결과 집합에 포함되는 행을 제한하는 것입니다.
LEFT JOIN의 ON 또는 USING 부분의 조건에 대해 오른쪽 테이블에 일치하는 행이 없으면 오른쪽 테이블은 NULL로 설정된 모든 열을 사용합니다.
산술 비교 연산자(예: =, )를 사용하여 NULL을 비교할 수 없습니다.

SELECT NULL = NULL;
SELECT NULL IS NULL;

mysql에서 고유한 여러 열 개수 문제를 해결하는 방법

두 번째 문제는 NULL=NULL의 결과가 항상 False이므로 원래 동일한 데이터의 두 행이 동일하지 않게 된다는 것입니다.

그러나 이것이 첫 번째 문제, 즉 중복 제거 후 데이터 조각이 사라지는 이유는 해결되지 않습니다. 그러나 누락된 데이터는 아마도 NULL 값과 관련이 있을 것으로 추측할 수 있습니다.

카운트와 구별의 두 가지 연산을 분리합니다.

SELECT COUNT(*) as cnt FROM (SELECT  DISTINCT id, a, b FROM test_distinct) as tmp;

mysql에서 고유한 여러 열 개수 문제를 해결하는 방법

응? 결과는 정확합니다. 이는 count(distinct expr)에 의해 생성된 쿼리 계획이 우리가 상상한 것과 다를 수 있음을 의미합니다. 중복 항목을 먼저 제거한 다음 쿼리 계획을 분석하기 위해 설명을 사용하지 않습니다. count(distinct expr)生成的查询计划可能和我们想象的不一样，并不是先去重再统计，使用explain分析一下两条语句的查询计划，如下所示：

mysql에서 고유한 여러 열 개수 문제를 해결하는 방법

从表中可以看到，mysql执行引擎直接将count(distinct expr)作为一个查询，查看官方文档：

mysql에서 고유한 여러 열 개수 문제를 해결하는 방법

解决办法

至此问题才终于弄清楚了。解决这个问题的办法有两种，第一种就是上述的先去重后统计，第二种可以利用IFNULL()

mysql에서 고유한 여러 열 개수 문제를 해결하는 방법 표에서 볼 수 있듯이 mysql 실행 엔진은 count(distinct expr)를 쿼리로 직접 사용합니다. 공식 문서를 확인하세요:

mysql에서 카운트 고유 다중 열 문제를 해결하는 방법 mysql에서 고유한 여러 열 개수 문제를 해결하는 방법

Solution

The 문제가 마침내 밝혀졌습니다. 이 문제를 해결하는 방법에는 두 가지가 있습니다. 첫 번째는 중복 항목을 먼저 제거한 다음 개수를 계산하는 것입니다. 두 번째는 IFNULL() 함수를 사용하는 것입니다:

SELECT COUNT(DISTINCT id, a, IFNULL(b, &#39;0&#39;)) as cnt FROM test_distinct;

또한, count() 사용법:

SELECT id, a, b, COUNT(*) FROM test_distinct GROUP BY id, a, b;
SELECT id, a, b, COUNT(b) FROM test_distinct GROUP BY id, a, b;

🎜🎜Knowledge point🎜🎜🎜🎜null 값을 비교하기 위해 산술 비교 연산자(예: =, )를 사용할 수 없습니다. 🎜🎜🎜🎜count(distinct expr)는 숫자를 반환합니다. expr 열의 고유하고 비어 있지 않은 행 🎜
COUNT()에는 두 가지 용도가 있습니다. 열의 값 수를 계산하는 데 사용하거나 행 수를 계산하는 데 사용할 수 있습니다. 컬럼 값을 계산할 때 컬럼 값은 Null이 아니어야 합니다(NULL은 계산되지 않음). COUNT() 함수의 괄호 안에 열이나 표현식이 지정되면 해당 표현식에 값이 있는 결과의 개수가 계산됩니다. COUNT()의 또 다른 기능은 결과 집합의 행 수를 계산하는 것입니다. MySQL은 대괄호 안의 표현식 값이 비어 있을 수 없음을 확인하면 실제로 행 수를 계산합니다. 가장 간단한 것은 COUNT()를 사용하는 것입니다. 이 경우 와일드카드는 우리가 추측한 대로 모든 열로 확장되지 않습니다. 실제로 모든 열을 무시하고 모든 행을 직접 계산합니다. - "고성능 MySQL";
InnoDB에서는 SELECT COUNT(*)와 SELECT COUNT(1)이 동일하게 처리되며 성능상의 차이는 없습니다.

위 내용은 mysql에서 고유한 여러 열 개수 문제를 해결하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

이 기사는 亿速云에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제

관련 기사

MySQL과 다른 SQL 방언의 구문의 차이점은 무엇입니까?Apr 27, 2025 am 12:26 AM

mysqldiffersfromothersqldialectsinsyntaxforlimit, 자동 점유, 문자열 comparison, 하위 쿼리 및 퍼포먼스 앤 알리 분석 .1) mysqluse Slimit, whilesqlSerVerusestOpandoracleSrownum.2) MySql'Sauto_incrementContrastSwithPostgresql'serialandoracle '

MySQL 파티셔닝이란 무엇입니까?Apr 27, 2025 am 12:23 AM

MySQL 파티셔닝은 성능을 향상시키고 유지 보수를 단순화합니다. 1) 큰 테이블을 특정 기준 (예 : 날짜 범위)으로 작은 조각으로 나누고, 2) 데이터를 독립적 인 파일로 물리적으로 나눌 수 있습니다.

MySQL에서 어떻게 권한을 부여하고 취소합니까?Apr 27, 2025 am 12:21 AM

MySQL에서 권한을 부여하고 취소하는 방법은 무엇입니까? 1. 보조금 명세서를 사용하여 grantallprivilegesondatabase_name.to'username'@'host '와 같은 부여 권한; 2. Revoke 문을 사용하여 Revokeallprivilegesondatabase_name.from'username'@'host '와 같은 권한을 취소하여 허가 변경의 적시에 의사 소통을 보장하십시오.

InnoDB와 MyISAM 스토리지 엔진의 차이점을 설명하십시오.Apr 27, 2025 am 12:20 AM

InnoDB는 거래 지원 및 높은 동시성이 필요한 응용 프로그램에 적합한 반면, MyISAM은 더 많은 읽기와 덜 쓰는 응용 프로그램에 적합합니다. 1. INNODB는 전자 상거래 및 은행 시스템에 적합한 거래 및 은행 수준의 자물쇠를 지원합니다. 2. Myisam은 블로깅 및 컨텐츠 관리 시스템에 적합한 빠른 읽기 및 색인을 제공합니다.

MySQL의 다른 유형의 조인은 무엇입니까?Apr 27, 2025 am 12:13 AM

MySQL에는 Innerjoin, Leftjoin, RightJoin 및 FullouterJoin의 네 가지 주요 조인 유형이 있습니다. 1. 결합 조건을 충족하는 두 테이블의 모든 행을 반환합니다. 2. Leftjoin 오른쪽 테이블에 일치하는 행이 없더라도 왼쪽 테이블의 모든 행을 반환합니다. 3. RightJoin은 LeftJoin과 상반되며 오른쪽 테이블의 모든 행을 반환합니다. 4. FULLOUTERNOIN은 조건을 충족 시키거나 충족하지 않는 두 테이블의 모든 행을 반환합니다.

MySQL에서 사용 가능한 다른 스토리지 엔진은 무엇입니까?Apr 26, 2025 am 12:27 AM

mysqloffersvariousStorageEngines, 각각의 everitedforentUsecases : 1) innodbisidealforapplicationsneedingAcidCoInceandHighConcurrency, 지원 트랜잭션 및 foreignKeys.2) myIsAmisbestforread-heverworkloads, memoryengineis

MySQL의 일반적인 보안 취약점은 무엇입니까?Apr 26, 2025 am 12:27 AM

MySQL의 일반적인 보안 취약점에는 SQL 주입, 약한 암호, 부적절한 권한 구성 및 업데이트되지 않은 소프트웨어가 포함됩니다. 1. 전처리 명령문을 사용하여 SQL 주입을 방지 할 수 있습니다. 2. 강력한 비밀번호 전략을 사용하여 약한 암호는 피할 수 있습니다. 3. 정기적 인 검토 및 사용자 권한 조정을 통해 부적절한 권한 구성을 해결할 수 있습니다. 4. Unupdated 소프트웨어는 MySQL 버전을 정기적으로 확인하고 업데이트하여 패치 할 수 있습니다.

MySQL에서 느린 쿼리를 어떻게 식별 할 수 있습니까?Apr 26, 2025 am 12:15 AM

느린 쿼리 로그를 활성화하고 임계 값을 설정하여 MySQL에서 느린 쿼리를 식별 할 수 있습니다. 1. 느린 쿼리 로그를 활성화하고 임계 값을 설정하십시오. 2. 느린 쿼리 로그 파일을보고 분석하고 심층 분석을 위해 MySQLDumpSlow 또는 PT-Query 소수성과 같은 도구를 사용하십시오. 3. 인덱스 최적화, 쿼리 재 작성 및 select*의 사용을 피함으로써 느린 쿼리 최적화를 달성 할 수 있습니다.

See all articles

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

SublimeText3 영어 버전

권장 사항: Win 버전, 코드 프롬프트 지원!

SecList

SecLists는 최고의 보안 테스터의 동반자입니다. 보안 평가 시 자주 사용되는 다양한 유형의 목록을 한 곳에 모아 놓은 것입니다. SecLists는 보안 테스터에게 필요할 수 있는 모든 목록을 편리하게 제공하여 보안 테스트를 더욱 효율적이고 생산적으로 만드는 데 도움이 됩니다. 목록 유형에는 사용자 이름, 비밀번호, URL, 퍼징 페이로드, 민감한 데이터 패턴, 웹 셸 등이 포함됩니다. 테스터는 이 저장소를 새로운 테스트 시스템으로 간단히 가져올 수 있으며 필요한 모든 유형의 목록에 액세스할 수 있습니다.