>  기사  >  데이터 베이스  >  오라클에서 중복 데이터를 삭제하는 방법

오라클에서 중복 데이터를 삭제하는 방법

PHPz
PHPz원래의
2023-04-25 09:01:223056검색

데이터 처리 중에 데이터 중복 문제가 자주 발생합니다. 데이터의 정확성과 데이터 웨어하우스의 명확성을 보장하기 위해 데이터베이스에서 중복된 데이터를 삭제해야 하는 경우가 많습니다. 이번 글에서는 오라클 데이터베이스에서 중복된 데이터를 삭제하는 방법을 소개합니다.

  1. 데이터 중복 확인

중복 데이터를 삭제하기 전에 먼저 어떤 데이터가 중복되었는지 확인해야 합니다. SELECT 문과 GROUP BY 문을 사용하여 중복 데이터를 쿼리할 수 있습니다. 예를 들어 "columnname"이라는 필드를 포함하는 "tablename"이라는 테이블이 있습니다. 다음 명령문을 사용하여 모든 중복 데이터를 찾을 수 있습니다.

SELECT 컬럼 이름, COUNT(*) as count
FROM 테이블 이름
GROUP BY 컬럼 이름
HAVING COUNT(*) > 1;

이 명령문은 다음의 합계를 반환합니다. 모든 중복 데이터의 수 반복 필드 값. 모든 중복 데이터를 삭제하려면 다음 명령문을 사용할 수 있습니다:

DELETE FROM tablename
WHERE 컬럼 이름 IN (SELECT 컬럼 이름
FROM 테이블 이름
GROUP BY 컬럼 이름
HAVING COUNT(*) > 1);

여기서 명령문 "IN" 키워드는 "columnname" 필드에서 중복 항목을 선택한 다음 해당 행을 삭제한다는 의미입니다.

  1. Oracle 데이터베이스에서 ROWID

를 사용하여 데이터 중복 제거 ROWID는 데이터베이스의 고유 식별자입니다. ROWID를 사용하여 중복 데이터를 제거할 수 있습니다. 다음은 ROWID를 사용하여 중복 데이터를 삭제하는 예입니다.

DELETE FROM tablename
WHERE ROWID NOT IN

(SELECT MIN(ROWID) 
 FROM tablename 
 GROUP BY columnname);

이 명령문은 첫 번째 중복 행을 제외한 모든 중복 행을 삭제합니다. "SELECT" 문에서는 "columnname" 필드의 가장 작은 ROWID를 쿼리하고 이를 행 ID의 다른 중복 값과 비교합니다. 첫 번째 중복 행의 ROWID만 다른 ROWID와 일치하지 않으며 데이터베이스에 유지됩니다.

  1. CTE를 사용하여 중복 데이터 제거

공용 테이블 표현식(CTE)을 사용하는 것도 중복 데이터를 제거하는 방법입니다. 다음은 CTE를 사용하여 중복 데이터를 제거하는 예입니다.

WITH cte AS

(SELECT columnname, 
        ROW_NUMBER() OVER 
            (PARTITION BY columnname ORDER BY columnname) AS rn 
 FROM tablename)

DELETE FROM cte
WHERE rn > 1;

이 예에서는 "SELECT" 문을 사용하여 CTE 이름을 "cte"로 지정합니다. ". 이 문은 ROW_NUMBER() 함수를 사용하여 "columnname" 필드를 기준으로 데이터를 오름차순(ORDER BY)으로 분할하고 정렬합니다.

  1. DISTINCT 키워드를 사용하여 중복 데이터 제거

Oracle 데이터베이스에서 중복 데이터를 제거하는 마지막 방법은 DISTINCT 키워드를 사용하는 것입니다. DISTINCT 사용 방법 키워드 중복 제거의 예:

DELETE FROM tablename
WHERE 컬럼 이름 NOT IN

(SELECT DISTINCT columnname 
 FROM tablename);

이 예에서는 하위 쿼리에서 DISTINCT 키워드를 사용하여 고유한 "columnname"을 찾습니다. ". " 값을 입력하고 "columnname" 필드와 비교합니다. 이 명령문은 하위 쿼리 결과에 포함된 중복 데이터를 모두 제거합니다.

요약

중복 데이터 제거는 데이터 처리에 있어 중요한 단계입니다. Oracle Database가 제공하는 방법에는 여러 가지가 있습니다. 중복 행을 삭제하려면 SELECT 문과 GROUP BY 문을 사용하여 중복된 데이터를 확인한 다음 DELETE 문을 사용하여 ROWID, CTE 및 DISTINCT 키를 사용할 수도 있습니다. 데이터베이스에서 중복 데이터를 제거하기 위해 이러한 기술을 사용하면 데이터 정확성과 데이터 웨어하우스 명확성을 보장할 수 있습니다

위 내용은 오라클에서 중복 데이터를 삭제하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.