>데이터 베이스 >MySQL 튜토리얼 >MySQL 하위 쿼리의 EXISTS와 IN: 어느 것이 더 성능이 좋나요?

MySQL 하위 쿼리의 EXISTS와 IN: 어느 것이 더 성능이 좋나요?

DDD
DDD원래의
2025-01-03 16:11:43906검색

EXISTS vs. IN in MySQL Subqueries: Which is More Performant?

하위 쿼리 최적화: MySQL의 EXISTS와 IN

MySQL에서 EXISTS와 IN을 사용하는 하위 쿼리는 비슷한 결과를 얻을 수 있지만 성능에 미치는 영향은 대조적입니다. 이 문서에서는 이러한 기술 간의 차이점을 자세히 살펴보고 쿼리 실행 시간에 미치는 영향을 살펴봅니다.

성능 비교 쿼리

제공된 예는 서로 다른 접근 방식을 사용하여 동일한 결과를 산출하는 두 개의 하위 쿼리를 보여줍니다.

방법 1 (IN)

SELECT
   *       
FROM
   tracker       
WHERE
   reservation_id IN (
      SELECT
         reservation_id                                 
      FROM
         tracker                                 
      GROUP  BY
         reservation_id                                 
      HAVING
         (
            method = 1                                          
            AND type = 0                                          
            AND Count(*) > 1 
         )                                         
         OR (
            method = 1                                              
            AND type = 1                                              
            AND Count(*) > 1 
         )                                         
         OR (
            method = 2                                              
            AND type = 2                                              
            AND Count(*) > 0 
         )                                         
         OR (
            method = 3                                              
            AND type = 0                                              
            AND Count(*) > 0 
         )                                         
         OR (
            method = 3                                              
            AND type = 1                                              
            AND Count(*) > 1 
         )                                         
         OR (
            method = 3                                              
            AND type = 3                                              
            AND Count(*) > 0 
         )
   )

방법 2(EXISTS)

SELECT
    *                                
FROM
    `tracker` t                                
WHERE
    EXISTS (
      SELECT
        reservation_id                                              
      FROM
        `tracker` t3                                              
      WHERE
        t3.reservation_id = t.reservation_id                                              
      GROUP BY
        reservation_id                                              
      HAVING
        (
            METHOD = 1 
            AND TYPE = 0 
            AND COUNT(*) > 1
        ) 
        OR                                                     
        (
            METHOD = 1 
            AND TYPE = 1 
            AND COUNT(*) > 1
        ) 
        OR                                                    
        (
            METHOD = 2 
            AND TYPE = 2 
            AND COUNT(*) > 0
        ) 
        OR                                                     
        (
            METHOD = 3 
            AND TYPE = 0 
            AND COUNT(*) > 0
        ) 
        OR                                                     
        (
            METHOD = 3 
            AND TYPE = 1 
            AND COUNT(*) > 1
        ) 
        OR                                                     
        (
            METHOD = 3 
            AND TYPE = 3 
            AND COUNT(*) > 0
        )                                             
    )

방법 1(IN)을 실행하는 데 약 10초가 소요되는 것으로 관찰됩니다. , 방법 2(EXISTS)는 1초 이내에 완료됩니다. 이러한 상당한 성능 차이는 탐구를 보장합니다.

하위 쿼리 동작

자세히 살펴보면 이러한 하위 쿼리가 다양한 기술을 사용하여 특정 조건을 충족하는 추적 테이블의 행을 식별한다는 것을 알 수 있습니다.

IN 하위 쿼리(방법 1): 이 하위 쿼리는 지정된 조건을 충족하는 booking_id 집합을 반환합니다. 기준. 그런 다음 외부 쿼리는 추적기의 각 행에 대한 booking_id가 이 세트에 존재하는지 확인하고 일치하는 행을 반환합니다.

EXISTS 하위 쿼리(방법 2): EXISTS는 추적기 테이블이 특정 Reservation_id에 대해 지정된 조건을 충족합니다. 그런 다음 외부 쿼리는 이 조건을 평가하고 EXISTS가 true를 반환하는 행을 반환합니다.

성능 고려 사항

이러한 접근 방식 간의 성능 차이는 기본 논리와 효율성에서 비롯됩니다.

  • EXISTS: EXISTS는 일련의 그룹화 작업을 수행하여 조건을 충족하는 행이 있는지 확인합니다. 이 접근 방식은 추적기 테이블의 행 수가 많을 때 더 효율적입니다.
  • IN: IN은 추적기 테이블의 모든 Reservation_id를 하위 쿼리에서 반환된 집합과 비교합니다. 특히 하위 쿼리가 많은 수의 쿼리를 반환하는 경우 비용이 더 많이 듭니다. 행.

결론

일반적으로 EXISTS는 대규모 하위 쿼리 결과를 처리할 때 선호되는 접근 방식이며 하위 쿼리의 NULL 값에 민감하지 않습니다. 반면 IN은 하위 쿼리 결과가 상대적으로 작고 NULL 값이 문제가 되지 않을 때 더 효율적일 수 있습니다.

성능을 더욱 최적화하려면 다음을 고려하는 것이 좋습니다.

  • 적절한 인덱스 사용: 추적기 테이블의 Reservation_id 열에 효율적인 인덱스가 있는지 확인하세요. lookups.
  • 하위 쿼리 결과 제한: LIMIT 또는 WHERE 필터링과 같은 기술을 사용하여 하위 쿼리에서 반환되는 행 수를 줄입니다.

위 내용은 MySQL 하위 쿼리의 EXISTS와 IN: 어느 것이 더 성능이 좋나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.