집 >데이터 베이스 >MySQL 튜토리얼 >PostgreSQL에서 고유 제약 조건이 있는 대규모 테이블에서 중복 행을 효율적으로 제거하려면 어떻게 해야 합니까?
PostgreSQL에서 고유 제약 조건이 있는 대규모 테이블에서 중복 항목을 효율적으로 제거
중복 항목이 포함된 대규모 테이블(수백만 개의 행)에 고유 제약 조건을 추가하는 것은 표준 SQL DELETE
문의 시간 소모적 특성으로 인해 심각한 문제를 야기합니다. 이 기사에서는 보다 효율적인 솔루션을 살펴봅니다.
PostgreSQL 확장과 USING
절을 활용하는 매우 효과적인 방법입니다. 다음 쿼리를 고려해보세요.
<code class="language-sql">DELETE FROM table USING table AS alias WHERE table.field1 = alias.field1 AND table.field2 = alias.field2 AND table.max_field < alias.max_field;</code>
이 쿼리는 중복 행을 교묘하게 제거합니다. field1
, field2
을 기준으로 중복을 식별하고 max_field
값이 가장 높은 행을 유지하고 값이 낮은 행을 삭제합니다.
예를 들어 email
테이블의 user_accounts
열에 고유성을 적용하고 가장 최근에 생성된 계정(가장 높은 id
)을 유지하려면 쿼리는 다음과 같습니다.
<code class="language-sql">DELETE FROM user_accounts USING user_accounts AS ua2 WHERE user_accounts.email = ua2.email AND user_accounts.id < ua2.id;</code>
USING
절은 이 PostgreSQL 전용 접근 방식의 효율성을 높이는 핵심입니다. 대규모 데이터 세트를 처리할 때 기존 DELETE
방법에 비해 성능이 크게 향상됩니다.
위 내용은 PostgreSQL에서 고유 제약 조건이 있는 대규모 테이블에서 중복 행을 효율적으로 제거하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!