집 >데이터 베이스 >MySQL 튜토리얼 >고유 식별자 없이 Netezza에서 중복 행을 효율적으로 삭제하는 방법은 무엇입니까?
Netezza에서 고유 식별자 없이 중복 행을 효율적으로 제거
중복 행이 포함된 대규모 테이블을 처리할 때 이를 제거하는 가장 효율적인 방법을 찾는 것이 어려울 수 있습니다. 이 쿼리는 SQL에서 작동하는 것으로 입증되었지만 Netezza에서는 어떻습니까?
원시 SQL 쿼리
<code class="language-sql">WITH TempEmp AS ( SELECT name, ROW_NUMBER() OVER(PARTITION by name, address, zipcode ORDER BY name) AS duplicateRecCount FROM mytable ) DELETE FROM TempEmp WHERE duplicateRecCount > 1;</code>
Netezza 솔루션
WITH 절 뒤의 DELETE 문은 Netezza와 호환되지 않습니다. USING 키워드를 사용하여 다음 해결 방법을 고려해 보십시오.
<code class="language-sql">DELETE FROM table_with_dups T1 USING table_with_dups T2 WHERE T1.ctid < T2.ctid AND T1.name = T2.name AND T1.address = T2.address AND T1.zipcode = T2.zipcode;</code>
결과 미리보기
레코드를 삭제하기 전에 검토하려면 다음과 같이 DELETE를 SELECT *로 바꾸고 USING을 쉼표로 바꾸세요.
<code class="language-sql">SELECT * FROM table_with_dups T1, table_with_dups T2 WHERE T1.ctid < T2.ctid AND T1.name = T2.name AND T1.address = T2.address AND T1.zipcode = T2.zipcode;</code>
실적 노트
중복이 거의 없을 것으로 예상되는 경우 이 솔루션은 하위 쿼리에 많은 수의 행을 생성하는 NOT IN (...) 절을 사용하는 솔루션보다 성능이 더 좋습니다. 또한 키 열에 NULL 값이 포함된 경우 COALESCE()를 사용하여 비교를 처리합니다. 예:
<code class="language-sql">AND COALESCE(T1.col_with_nulls, '[NULL]') = COALESCE(T2.col_with_nulls, '[NULL]')</code>
위 내용은 고유 식별자 없이 Netezza에서 중복 행을 효율적으로 삭제하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!