>데이터 베이스 >MySQL 튜토리얼 >복합 기본 키가 있는 Postgres 테이블에서 내 SELECT DISTINCT 쿼리가 느린 이유는 무엇이며 성능을 어떻게 향상시킬 수 있습니까?

복합 기본 키가 있는 Postgres 테이블에서 내 SELECT DISTINCT 쿼리가 느린 이유는 무엇이며 성능을 어떻게 향상시킬 수 있습니까?

Mary-Kate Olsen
Mary-Kate Olsen원래의
2025-01-07 18:33:41355검색

Why is my SELECT DISTINCT query slow on a Postgres table with a composite primary key, and how can I improve its performance?

Postgres에서 느린 SELECT DISTINCT 쿼리 최적화

이 문서에서는 복합 기본 키가 있는 대규모 Postgres 테이블에서 SELECT DISTINCT 쿼리를 실행할 때 발생하는 성능 문제를 다룹니다. 거의 200만 행이 포함된 테이블과 복합 기본 키(product_id, trade_id)가 포함된 특정 시나리오를 검사합니다. SELECT DISTINCT product_id 쿼리는 기본 키 인덱스로 인해 이상적으로 빨라야 하지만 예기치 않게 성능이 저하되었습니다.

근본 원인 분석:

쿼리 플래너가 인덱스를 활용하지 않고 순차 스캔을 선택한 것이 병목 현상으로 식별되었습니다. 이는 테이블의 데이터 분포에 기인합니다. 고유한 제품 ID가 40개만 존재하므로 인덱스 값 반복 수준이 높습니다. 이로 인해 수많은 인덱스 조사와 비효율적인 순차 액세스가 발생합니다.

효과적인 솔루션: 재귀적 CTE

이러한 제한을 피하고 인덱싱을 효율적으로 활용하기 위해 SELECT DISTINCT:

에 대한 우수한 대안으로 재귀 공통 테이블 표현식(CTE)이 제안되었습니다.
<code class="language-sql">WITH RECURSIVE cte AS (
   (   -- parentheses required
   SELECT product_id
   FROM   tickers
   ORDER  BY 1
   LIMIT  1
   )
   UNION ALL
   SELECT l.*
   FROM   cte c
   CROSS  JOIN LATERAL (
      SELECT product_id
      FROM   tickers t
      WHERE  t.product_id > c.product_id  -- lateral reference
      ORDER  BY 1
      LIMIT  1
      ) l
   )
TABLE  cte;</code>

이 재귀 CTE는 인덱스 건너뛰기 스캔을 효과적으로 모방합니다. 정렬된 순서로 고유한 product_id 값을 반복적으로 검색하여 비효율적인 순차 스캔과 관련된 성능 저하를 방지합니다. 이 접근 방식의 성능을 최적화하려면 product_id 열에 인덱스를 사용하는 것이 중요합니다.

중요 사항: Postgres의 인덱스 건너뛰기 스캔 기능이 개발 중이지만 이 CTE 기반 해결 방법은 설명된 시나리오에 대한 강력하고 효율적인 솔루션을 제공하여 쿼리 성능을 크게 향상시킵니다.

위 내용은 복합 기본 키가 있는 Postgres 테이블에서 내 SELECT DISTINCT 쿼리가 느린 이유는 무엇이며 성능을 어떻게 향상시킬 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.