데이터 처리 중에 데이터 중복 문제가 자주 발생합니다. 데이터의 정확성과 데이터 웨어하우스의 명확성을 보장하기 위해 데이터베이스에서 중복된 데이터를 삭제해야 하는 경우가 많습니다. 이번 글에서는 오라클 데이터베이스에서 중복된 데이터를 삭제하는 방법을 소개합니다.
중복 데이터를 삭제하기 전에 먼저 어떤 데이터가 중복되었는지 확인해야 합니다. SELECT 문과 GROUP BY 문을 사용하여 중복 데이터를 쿼리할 수 있습니다. 예를 들어 "columnname"이라는 필드를 포함하는 "tablename"이라는 테이블이 있습니다. 다음 명령문을 사용하여 모든 중복 데이터를 찾을 수 있습니다.
SELECT 컬럼 이름, COUNT(*) as count
FROM 테이블 이름
GROUP BY 컬럼 이름
HAVING COUNT(*) > 1;
이 명령문은 다음의 합계를 반환합니다. 모든 중복 데이터의 수 반복 필드 값. 모든 중복 데이터를 삭제하려면 다음 명령문을 사용할 수 있습니다:
DELETE FROM tablename
WHERE 컬럼 이름 IN (SELECT 컬럼 이름
FROM 테이블 이름
GROUP BY 컬럼 이름
HAVING COUNT(*) > 1);
여기서 명령문 "IN" 키워드는 "columnname" 필드에서 중복 항목을 선택한 다음 해당 행을 삭제한다는 의미입니다.
를 사용하여 데이터 중복 제거 ROWID는 데이터베이스의 고유 식별자입니다. ROWID를 사용하여 중복 데이터를 제거할 수 있습니다. 다음은 ROWID를 사용하여 중복 데이터를 삭제하는 예입니다.
DELETE FROM tablename
WHERE ROWID NOT IN
(SELECT MIN(ROWID) FROM tablename GROUP BY columnname);
이 명령문은 첫 번째 중복 행을 제외한 모든 중복 행을 삭제합니다. "SELECT" 문에서는 "columnname" 필드의 가장 작은 ROWID를 쿼리하고 이를 행 ID의 다른 중복 값과 비교합니다. 첫 번째 중복 행의 ROWID만 다른 ROWID와 일치하지 않으며 데이터베이스에 유지됩니다.
공용 테이블 표현식(CTE)을 사용하는 것도 중복 데이터를 제거하는 방법입니다. 다음은 CTE를 사용하여 중복 데이터를 제거하는 예입니다.
WITH cte AS
(SELECT columnname, ROW_NUMBER() OVER (PARTITION BY columnname ORDER BY columnname) AS rn FROM tablename)
DELETE FROM cte
WHERE rn > 1;
이 예에서는 "SELECT" 문을 사용하여 CTE 이름을 "cte"로 지정합니다. ". 이 문은 ROW_NUMBER() 함수를 사용하여 "columnname" 필드를 기준으로 데이터를 오름차순(ORDER BY)으로 분할하고 정렬합니다.
Oracle 데이터베이스에서 중복 데이터를 제거하는 마지막 방법은 DISTINCT 키워드를 사용하는 것입니다. DISTINCT 사용 방법 키워드 중복 제거의 예:
DELETE FROM tablename
WHERE 컬럼 이름 NOT IN
(SELECT DISTINCT columnname FROM tablename);
이 예에서는 하위 쿼리에서 DISTINCT 키워드를 사용하여 고유한 "columnname"을 찾습니다. ". " 값을 입력하고 "columnname" 필드와 비교합니다. 이 명령문은 하위 쿼리 결과에 포함된 중복 데이터를 모두 제거합니다.
요약
중복 데이터 제거는 데이터 처리에 있어 중요한 단계입니다. Oracle Database가 제공하는 방법에는 여러 가지가 있습니다. 중복 행을 삭제하려면 SELECT 문과 GROUP BY 문을 사용하여 중복된 데이터를 확인한 다음 DELETE 문을 사용하여 ROWID, CTE 및 DISTINCT 키를 사용할 수도 있습니다. 데이터베이스에서 중복 데이터를 제거하기 위해 이러한 기술을 사용하면 데이터 정확성과 데이터 웨어하우스 명확성을 보장할 수 있습니다
위 내용은 오라클에서 중복 데이터를 삭제하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!