>데이터 베이스 >MySQL 튜토리얼 >고유 식별자 없이 Netezza에서 중복 행을 효율적으로 삭제하는 방법은 무엇입니까?

고유 식별자 없이 Netezza에서 중복 행을 효율적으로 삭제하는 방법은 무엇입니까?

Barbara Streisand
Barbara Streisand원래의
2025-01-12 11:27:41479검색

How to Efficiently Delete Duplicate Rows in Netezza Without a Unique Identifier?

Netezza에서 고유 식별자 없이 중복 행을 효율적으로 제거

중복 행이 포함된 대규모 테이블을 처리할 때 이를 제거하는 가장 효율적인 방법을 찾는 것이 어려울 수 있습니다. 이 쿼리는 SQL에서 작동하는 것으로 입증되었지만 Netezza에서는 어떻습니까?

원시 SQL 쿼리

<code class="language-sql">WITH TempEmp AS
(
SELECT name, ROW_NUMBER() OVER(PARTITION by name, address, zipcode ORDER BY name) AS duplicateRecCount
FROM mytable
)
DELETE FROM TempEmp
WHERE duplicateRecCount > 1;</code>

Netezza 솔루션

WITH 절 뒤의 DELETE 문은 Netezza와 호환되지 않습니다. USING 키워드를 사용하여 다음 해결 방법을 고려해 보십시오.

<code class="language-sql">DELETE FROM table_with_dups T1
USING table_with_dups T2
WHERE T1.ctid < T2.ctid
AND T1.name = T2.name
AND T1.address = T2.address
AND T1.zipcode = T2.zipcode;</code>

결과 미리보기

레코드를 삭제하기 전에 검토하려면 다음과 같이 DELETE를 SELECT *로 바꾸고 USING을 쉼표로 바꾸세요.

<code class="language-sql">SELECT * FROM table_with_dups T1, table_with_dups T2
WHERE T1.ctid < T2.ctid
AND T1.name = T2.name
AND T1.address = T2.address
AND T1.zipcode = T2.zipcode;</code>

실적 노트

중복이 거의 없을 것으로 예상되는 경우 이 솔루션은 하위 쿼리에 많은 수의 행을 생성하는 NOT IN (...) 절을 사용하는 솔루션보다 성능이 더 좋습니다. 또한 키 열에 NULL 값이 포함된 경우 COALESCE()를 사용하여 비교를 처리합니다. 예:

<code class="language-sql">AND COALESCE(T1.col_with_nulls, '[NULL]') = COALESCE(T2.col_with_nulls, '[NULL]')</code>

위 내용은 고유 식별자 없이 Netezza에서 중복 행을 효율적으로 삭제하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.