>데이터 베이스 >MySQL 튜토리얼 >MySQL 하위 쿼리: 최적의 성능을 위해 언제 EXISTS와 IN을 사용해야 합니까?

MySQL 하위 쿼리: 최적의 성능을 위해 언제 EXISTS와 IN을 사용해야 합니까?

DDD
DDD원래의
2025-01-04 06:12:40194검색

MySQL Subqueries: When Should I Use EXISTS vs. IN for Optimal Performance?

MySQL에서 EXISTS와 IN을 사용한 하위 쿼리: 성능 최적화

MySQL에서 하위 쿼리를 사용할 때 IN을 사용하는 두 가지 일반적인 접근 방식이 있습니다. 연산자 및 EXISTS 연산자를 사용합니다. 두 방법 모두 비슷한 결과를 얻을 수 있지만 성능에서는 상당한 차이가 있을 수 있습니다.

다음 두 가지 하위 쿼리 예를 고려하세요.

방법 1(IN):

SELECT
   *       
FROM
   tracker       
WHERE
   reservation_id IN (
      SELECT
         reservation_id                                 
      FROM
         tracker                                 
      GROUP  BY
         reservation_id                                 
      HAVING
         (
            method = 1                                          
            AND type = 0                                          
            AND Count(*) > 1 
         )                                         
         OR (
            method = 1                                              
            AND type = 1                                              
            AND Count(*) > 1 
         )                                         
         OR (
            method = 2                                              
            AND type = 2                                              
            AND Count(*) > 0 
         )                                         
         OR (
            method = 3                                              
            AND type = 0                                              
            AND Count(*) > 0 
         )                                         
         OR (
            method = 3                                              
            AND type = 1                                              
            AND Count(*) > 1 
         )                                         
         OR (
            method = 3                                              
            AND type = 3                                              
            AND Count(*) > 0 
         )
   )

방법 2 (존재):

SELECT
   *                                
FROM
   `tracker` t                                
WHERE
   EXISTS (
      SELECT
         reservation_id                                              
      FROM
         `tracker` t3                                              
      WHERE
         t3.reservation_id = t.reservation_id                                              
      GROUP BY
         reservation_id                                              
      HAVING
         (
            METHOD = 1 
            AND TYPE = 0 
            AND COUNT(*) > 1
         ) 
         OR                                                     
         (
            METHOD = 1 
            AND TYPE = 1 
            AND COUNT(*) > 1
         ) 
         OR                                                    
         (
            METHOD = 2 
            AND TYPE = 2 
            AND COUNT(*) > 0
         ) 
         OR                                                     
         (
            METHOD = 3 
            AND TYPE = 0 
            AND COUNT(*) > 0
         ) 
         OR                                                     
         (
            METHOD = 3 
            AND TYPE = 1 
            AND COUNT(*) > 1
         ) 
         OR                                                     
         (
            METHOD = 3 
            AND TYPE = 3 
            AND COUNT(*) > 0
         )                                             
   )

문제 설명에서 언급했듯이 방법 1은 방법 2보다 실행하는 데 훨씬 더 오래 걸립니다. 이는 두 접근 방식이 하위 쿼리를 처리하는 방식의 근본적인 차이 때문입니다.

IN 연산자:

IN 연산자를 사용할 때 MySQL은 다음을 실행합니다. 기본 쿼리의 각 행에 대해 한 번씩 하위 쿼리를 여러 번 수행합니다. 이 경우 추적기 테이블의 각 행에 대해 하위 쿼리가 실행되어 지정된 기준을 충족하는지 확인합니다. 이는 특히 하위 쿼리가 복잡하거나 많은 양의 데이터를 포함하는 경우 상당한 성능 오버헤드로 이어질 수 있습니다.

EXISTS 연산자:

반면에 EXISTS 연산자는 하위 쿼리를 한 번만 실행합니다. 메인 쿼리의 현재 행에 대한 하위 쿼리 결과에 일치하는 행이 하나 이상 있는지 확인합니다. 일치하는 항목이 있으면 EXISTS 조건이 true로 평가됩니다. 그렇지 않으면 거짓입니다. 이 접근 방식은 하위 쿼리에서 모든 행을 여러 번 검색할 필요가 없기 때문에 훨씬 더 효율적입니다.

IN과 EXISTS 중에서 선택:

일반적으로 다음과 같습니다. 대부분의 경우 더 나은 성능을 제공하므로 가능하면 EXISTS 연산자를 사용하는 것이 좋습니다. 올바른 선택을 하는 데 도움이 되는 몇 가지 지침은 다음과 같습니다.

  • 특정 기준과 일치하는 행이 있는지 확인해야 할 경우 EXISTS를 사용하세요.
  • 필요할 경우 IN을 사용하세요. 특정 기준과 일치하는 모든 행을 검색합니다.
  • 하위 쿼리 결과가 매우 크면 EXISTS가 성능이 뛰어납니다. IN.
  • 하위 쿼리 결과가 매우 작은 경우 IN이 EXISTS보다 성능이 뛰어날 수 있습니다.

추가 고려 사항:

  • Null 값 IN 연산자를 사용할 때 문제가 발생할 수 있습니다. 하위 쿼리가 Null을 반환하는 경우 전체 IN 조건이 Null로 평가되어 잠재적으로 기본 쿼리의 결과에 영향을 미칠 수 있습니다.
  • EXISTS는 더 다양하며 하위 쿼리가 여러 행을 반환하거나 집계 함수를 포함하는 경우를 처리할 수 있습니다.

위 내용은 MySQL 하위 쿼리: 최적의 성능을 위해 언제 EXISTS와 IN을 사용해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.