>  기사  >  데이터 베이스  >  Oracle에서 중복 데이터를 쿼리하는 방법

Oracle에서 중복 데이터를 쿼리하는 방법

PHPz
PHPz원래의
2023-04-18 16:00:1820435검색

Oracle에서는 특히 대용량 데이터를 처리할 때 중복 데이터를 쿼리하는 것이 일반적인 작업입니다. 반복되는 데이터 쿼리에는 데이터 유형, 인덱스 사용량, 성능 등을 포함한 많은 세부 사항과 요소를 고려해야 하는 경우가 많습니다.

이 기사에서는 Oracle에서 중복 데이터를 쿼리하는 방법을 소개하고 독자가 쿼리 작업을 보다 효율적으로 처리하는 데 도움이 되는 몇 가지 최적화 기술을 제공합니다.

1. GROUP BY 문을 사용하세요

GROUP BY 문은 Oracle이 중복 데이터를 쿼리하는 기본 방법입니다. 사용자는 이 명령문을 사용하여 지정된 필드에 따라 데이터를 그룹화하고 각 그룹의 총 데이터 수를 계산할 수 있습니다. 중복 항목 찾기는 일반적으로 이 통계적 합계를 기반으로 수행됩니다. 예를 들어, 다음 SQL 문은 이름이 1번 이상 나타나는 사람을 찾습니다.

SELECT name, COUNT(*) 
FROM person 
GROUP BY name 
HAVING COUNT(*) > 1;

이 쿼리는 이름이 1번 이상 나타나는 모든 사람과 해당 횟수를 반환합니다. 이 쿼리 문의 핵심은 데이터를 이름별로 그룹화하는 GROUP BY 절을 사용하는 것입니다. 또 다른 핵심은 발생 횟수가 1보다 큰 레코드를 필터링하는 HAVING 절입니다. 이 방법은 사람 이름, 생일 등과 같은 고유하지 않은 중복 인덱스 데이터를 찾는 데 적합합니다.

2. 내부 조인 사용

내부 조인은 Oracle에서 복잡한 쿼리를 처리하는 또 다른 방법입니다. 내부 조인을 통해 두 테이블을 병합한 후 WHERE 절을 사용하여 중복된 데이터를 찾을 수 있습니다. 예를 들어, 다음 SQL 문은 개인 테이블에서 중복된 이름을 찾습니다.

SELECT DISTINCT p1.name 
FROM person p1, person p2 
WHERE p1.name = p2.name AND p1.id <> p2.id;

이 쿼리에서 개인 테이블은 두 번 자체 조인되었으며 WHERE 절을 사용하여 이름은 같지만 ID가 다른 레코드를 찾습니다. DISTINCT 절을 사용하므로 쿼리 결과에는 고유한 이름만 포함됩니다. 이 방법은 주민등록번호, 휴대폰번호 등 중복된 고유 색인 데이터를 찾는 데 적합합니다.

3. ROW_NUMBER() OVER 문을 사용하세요

ROW_NUMBER() OVER 문은 중복 데이터 및 기타 일반적인 쿼리를 찾는 데 사용할 수 있는 Oracle의 고급 쿼리 방법입니다. ROW_NUMBER() OVER 문은 창 함수를 사용하여 쿼리 결과의 각 행에 행 번호를 할당합니다. 그런 다음 사용자는 WHERE 절을 사용하여 행 번호가 1보다 큰 레코드를 찾고 중복 데이터를 얻을 수 있습니다. 다음 SQL 문은 ROW_NUMBER() OVER 문을 사용하여 개인 테이블에서 중복된 이름을 찾습니다.

SELECT name 
FROM (SELECT name, ROW_NUMBER() OVER (PARTITION BY name ORDER BY id) rn 
      FROM person) 
WHERE rn > 1;

이 쿼리에서는 하위 쿼리를 사용하여 ID별로 이름을 정렬하고 ROW_NUMBER() OVER 문을 사용하여 행 번호를 할당합니다. . 그런 다음 기본 쿼리에서 WHERE 절을 사용하여 행 번호가 1보다 큰 레코드를 찾고 중복된 이름을 모두 출력합니다. 이 방법은 중복 데이터의 여러 열과 같이 고유하지 않은 여러 필드가 있는 데이터를 찾는 데 적합합니다.

4. 쿼리 성능 최적화

중복 데이터 쿼리 성능은 일반적으로 쿼리 작업의 주요 병목 현상입니다. 성능을 최적화하기 위해 다음 기술을 사용할 수 있습니다.

  1. 인덱스를 사용하여 쿼리를 최적화합니다. 중복 데이터를 쿼리할 때 인덱스를 사용하면 쿼리 속도가 빨라질 수 있습니다. 쿼리 개체가 고유하지 않은 인덱스인 경우 포함 인덱스를 사용하여 데이터 테이블에 액세스하지 않도록 할 수 있습니다. 그리고 쿼리 개체가 고유 인덱스인 경우 최상의 성능을 위해서는 내부 조인을 사용해야 합니다.
  2. 하위 쿼리를 사용하여 성능을 최적화하세요. 반복되는 데이터를 쿼리할 때 하위 쿼리를 사용하여 데이터를 전처리하고 하위 쿼리에 GROUP BY 문을 사용하여 쿼리 성능을 최적화할 수 있습니다.
  3. 검색 범위를 좁혀보세요. 중복된 데이터를 쿼리할 때 WHERE 절을 사용하여 몇 가지 조건을 추가하여 쿼리 범위를 좁히고 쿼리 속도를 높일 수 있습니다.
  4. 데이터를 일괄 처리합니다. 대용량 데이터를 포함하는 쿼리 작업의 경우 일괄 처리 방법을 사용하여 빅 데이터를 여러 개의 작은 데이터 세트로 분할하여 쿼리할 수 있으므로 한 번에 많은 양의 데이터를 처리하여 발생하는 성능 문제를 피할 수 있습니다.

요약:

중복 데이터 쿼리는 Oracle 쿼리 작업에서 일반적이고 중요한 작업일 뿐만 아니라 많은 최적화 기술과 조정 방법도 필요합니다. 쿼리 작업을 처리할 때는 데이터 유형, 인덱스 사용량, 성능 등 여러 요소를 고려하고 적절한 최적화 전략을 채택하여 더 빠르고 정확한 결과를 얻어야 합니다. 동시에, 이 글에서 소개한 방법과 기법이 독자들이 실제 작업에서 쿼리 작업을 보다 효율적으로 처리하는 데 도움이 되기를 바랍니다.

위 내용은 Oracle에서 중복 데이터를 쿼리하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.