집 >데이터 베이스 >MySQL 튜토리얼 >고유 식별자 없이 Netezza에서 중복 행을 효율적으로 삭제하는 방법은 무엇입니까?

고유 식별자 없이 Netezza에서 중복 행을 효율적으로 삭제하는 방법은 무엇입니까?

Barbara Streisand원래의: 2025-01-12 11:27:41557검색

How to Efficiently Delete Duplicate Rows in Netezza Without a Unique Identifier?

Netezza에서 고유 식별자 없이 중복 행을 효율적으로 제거

중복 행이 포함된 대규모 테이블을 처리할 때 이를 제거하는 가장 효율적인 방법을 찾는 것이 어려울 수 있습니다. 이 쿼리는 SQL에서 작동하는 것으로 입증되었지만 Netezza에서는 어떻습니까?

원시 SQL 쿼리

WITH TempEmp AS
(
SELECT name, ROW_NUMBER() OVER(PARTITION by name, address, zipcode ORDER BY name) AS duplicateRecCount
FROM mytable
)
DELETE FROM TempEmp
WHERE duplicateRecCount > 1;

Netezza 솔루션

WITH 절 뒤의 DELETE 문은 Netezza와 호환되지 않습니다. USING 키워드를 사용하여 다음 해결 방법을 고려해 보십시오.

DELETE FROM table_with_dups T1
USING table_with_dups T2
WHERE T1.ctid < T2.ctid
AND T1.name = T2.name
AND T1.address = T2.address
AND T1.zipcode = T2.zipcode;

결과 미리보기

레코드를 삭제하기 전에 검토하려면 다음과 같이 DELETE를 SELECT *로 바꾸고 USING을 쉼표로 바꾸세요.

SELECT * FROM table_with_dups T1, table_with_dups T2
WHERE T1.ctid < T2.ctid
AND T1.name = T2.name
AND T1.address = T2.address
AND T1.zipcode = T2.zipcode;

실적 노트

중복이 거의 없을 것으로 예상되는 경우 이 솔루션은 하위 쿼리에 많은 수의 행을 생성하는 NOT IN (...) 절을 사용하는 솔루션보다 성능이 더 좋습니다. 또한 키 열에 NULL 값이 포함된 경우 COALESCE()를 사용하여 비교를 처리합니다. 예:

AND COALESCE(T1.col_with_nulls, '[NULL]') = COALESCE(T2.col_with_nulls, '[NULL]')

위 내용은 고유 식별자 없이 Netezza에서 중복 행을 효율적으로 삭제하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

sql NULL select 标识符 using delete

성명：

이전 기사：SQL Server에서 날짜 범위를 효율적으로 검색하는 방법은 무엇입니까?다음 기사：SQL Server에서 날짜 범위를 효율적으로 검색하는 방법은 무엇입니까?