>데이터 베이스 >MySQL 튜토리얼 >SQL의 여러 열을 기반으로 중복 레코드를 효율적으로 식별하는 방법은 무엇입니까?

SQL의 여러 열을 기반으로 중복 레코드를 효율적으로 식별하는 방법은 무엇입니까?

Patricia Arquette
Patricia Arquette원래의
2025-01-04 19:11:39864검색

How to Efficiently Identify Duplicate Records Based on Multiple Columns in SQL?

여러 열에서 중복 레코드 식별

제시된 과제는 제공된 SQL 코드의 기능을 복제하는 것입니다. 이는 식별 및 검색을 목표로 합니다. "이름"과 "도시"라는 두 열의 조합을 기반으로 레코드를 복제합니다. 목표는 "이름" 또는 "도시" 열 중 하나만 일치하는 경우를 제외하고 두 열이 모두 동일한 레코드만 고려하는 것입니다.

이 요구 사항을 해결하기 위해 제공된 답변에서는 하위 쿼리를 활용하여 개수를 계산합니다. "stuff" 테이블 내에서 "name"과 "city" 조합이 모두 발생합니다. 이 하위 쿼리는 "이름"과 "도시"로 그룹화된 행 수를 계산하고 개수가 1보다 큰 해당 조합을 필터링하여 중복을 나타냅니다.

select name, city, count(*) as qty
from [stuff]
group by name, city
having count(*) > 1

그런 다음 기본 쿼리는 원래 "물건" 테이블을 조인합니다. 하위 쿼리 결과는 "name"과 "city" 모두에서 일치합니다. 이 조인 작업은 지정된 기준을 충족하는 중복 레코드를 효과적으로 식별합니다. 최종 결과는 하나의 열만 일치하는 경우를 제외하여 거짓양성을 제거합니다.

select s.id, t.*
from [stuff] s
join (
...
    select name, city, count(*) as qty
    from [stuff]
    group by name, city
    having count(*) > 1
) t on s.name = t.name and s.city = t.city

결과적으로 쿼리는 원하는 출력을 성공적으로 검색합니다.

id      name  city   
904834  jim   London  
904835  jim   London  
90145   Fred  Paris   
90132   Fred  Paris
90133   Fred  Paris

이 접근 방식은 효율적인 여러 열을 기반으로 중복 레코드를 식별하는 다목적 솔루션으로 쿼리 결과의 정확성과 완전성을 보장합니다.

위 내용은 SQL의 여러 열을 기반으로 중복 레코드를 효율적으로 식별하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.