이 글은 모두를 위한 Mysql 인덱스 실패를 기록하고 Mysql 인덱스 실패 원인을 분석하는 글이 여러분에게 도움이 되기를 바랍니다!
이 글에는 Mysql의 Where 조건 쿼리 실행 프로세스, 조인트 인덱스 매칭을 중지하는 범위 쿼리, 테이블 반환 연산 분석, 일반적인 인덱스 실패 시나리오, 추가 분석 및 기타 지식이 포함되어 있습니다. [관련 추천 : mysql 동영상 튜토리얼]
6천만 개의 데이터가 포함된 데이터 테이블에 전체 쿼리가 나타났습니다. sql 문을 복제해 보니 해당 쿼리가 인덱스를 거치지 않고 전체를 거치는 것으로 나타났습니다. 테이블 쿼리를 통해 인덱스 실패 이유를 알아보세요.
# sql语句 EXPLAIN SELECT count(*) FROM order_recipient_extend_tab WHERE start_date>'1628442000' and start_date<'1631120399' and station_id='1809' and status='2';
order_recipient_extend_tab 테이블에는 6천만 개의 데이터가 있습니다. 느린 쿼리의 쿼리 필드에는 start_date, station_id, status가 포함됩니다. 인덱스 설계의 원래 의도에 따르면 실제로 실패하는 인덱스는
joint 인덱스입니다. | 필드 1 | 필드 2 | 필드 3 |
---|---|---|---|
idx_date_station_driver | start_date | station_id | driver_id |
Mysql이 Where 조건 쿼리를 어떻게 실행하는지 이해하고, 인덱스 실패 원인에 대해 더 빠르고 명확하게 통찰력을 얻을 수 있습니다. 이 느린 쿼리에서 일치도가 높은 인덱스는 idx_date_station_driver
입니다. 이 느린 쿼리에서 where 조건 쿼리의 실행 과정을 분석해 보세요.
Mysql의 조건 추출 규칙은 색인 키(첫 번째 키 및 마지막 키), 색인 필터, 테이블 필터의 세 가지 주요 범주로 요약할 수 있습니다.
색인 키는 인덱스 트리에서 이 SQL 쿼리의 범위를 결정하는 데 사용됩니다. 범위에는 시작과 끝이 포함되며, Index First Key는 인덱스 쿼리의 시작 범위를 찾는 데 사용되고, Index Last Key는 인덱스 쿼리의 끝 범위를 찾는 데 사용됩니다.
Index First Key
추출 규칙: 인덱스의 첫 번째 필드부터 시작하여 해당 필드가 where 조건에 존재하는지 확인하고 조건이 =, >=인 경우 해당 조건을 Index에 추가합니다. First Key, 인덱스의 다음 필드가 존재하고 조건이 >이면 계속해서 읽고, Index First Key에 해당 조건을 추가한 후, 존재하지 않으면 Index First Key 추출도 종료합니다. Index First Key 추출 추출.
Index Last Key
는 Index First Key와 정반대입니다. 추출 규칙은 인덱스의 첫 번째 필드부터 시작하여 where 조건에 존재하는지 확인하고 조건이 =,
인덱스 키 추출 규칙에 따르면 이 느린 쿼리에서 추출된 마지막 인덱스 키는 start_date>'1628442000'이고, 마지막 인덱스 키는 start_date
Index First Key는 인덱스 B+ 트리의 루트 노드에서 시작하여 Index First Key 조건을 사용하고 이진 검색 방법을 사용하여 인덱스의 시작 범위를 찾는 데만 사용됩니다. . Where 쿼리 프로세스 동안 Index First Key는 한 번만 판단됩니다.
Index Last Key는 인덱스의 끝 범위를 찾는 데 사용됩니다. 따라서 시작 범위 이후에 읽혀지는 각 인덱스 레코드에 대해 Index Last Key의 범위를 초과했는지 여부를 확인해야 합니다. 쿼리가 종료됩니다.
Index Key에 의해 결정된 인덱스 범위에서 모든 인덱스 레코드가 쿼리 조건을 만족하는 것은 아닙니다. 예를 들어 Index Last Key 및 Index Last Key 범위에서 모든 인덱스 레코드가 station_id = '1809'를 만족하는 것은 아닙니다. 이때 Index Filter를 사용해야 합니다.
인덱스 필터(index pushdown라고도 함) 는 쿼리 조건을 충족하지 않는 인덱스 쿼리 범위의 레코드를 필터링하는 데 사용됩니다. 인덱스 범위의 각 레코드에 대해 인덱스 필터와 비교해야 하며, 인덱스 필터를 충족하지 않으면 직접 폐기되고 인덱스의 다음 레코드를 계속 읽습니다.
인덱스 필터 추출 규칙: 인덱스의 첫 번째 필드부터 시작하여 where 조건에 존재하는지 확인하고, 존재하고 조건이 =인 경우 첫 번째 필드를 건너뛰고 인덱스의 다음 필드를 계속 확인합니다. 다음 색인 열은 동일한 추출 규칙을 채택합니다(설명: = 조건이 있는 필드는 색인 키에서 필터링되었습니다). 조건이 >=, >,
인덱스 필터의 추출 규칙에 따르면, 이 느린 쿼리에서 추출된 인덱스 필터는 station_id='1809'입니다. Index Key에 의해 결정된 인덱스 쿼리 범위에서 인덱스 레코드를 순회할 때 station_id='1809'를 비교해야 합니다. 이 조건이 충족되지 않으면 바로 손실되고 인덱스의 다음 레코드를 계속해서 읽습니다. .
테이블 필터는 인덱스로 필터링할 수 없는 데이터를 필터링하는 데 사용됩니다. Secondary Index의 Primary Key를 통해 레코드의 행 전체를 조회한 후 해당 레코드가 Table Filter 조건을 만족하는지 판단하여 조건을 만족하지 않으면 해당 레코드는 사라지고 다음 레코드가 계속 유지된다. 판단. 추출 규칙은 매우 간단합니다. 인덱스 필드에 속하지 않는 모든 쿼리 조건은 테이블 필터로 분류됩니다. Table Filter의 추출 규칙에 따르면 이 쿼리의 Table Filter는 status='2'입니다.
요약 및 보충Index Key 및 Index Filter는 InnoDB 스토리지 계층에서 발생하고 Table Filter는 Mysql Server 계층에서 발생합니다.
MySQL5.6 이전에는 Index Filter와 Table Filter의 구분이 없었습니다. Index First Key와 Index Last Key 범위 내의 모든 인덱스 레코드를 테이블로 반환하여 전체 레코드를 읽은 후 MySQL 서버로 반환했습니다. 필터링을 위한 레이어입니다.
MySQL 5.6 이상에서는 인덱스 필터가 테이블 필터와 분리되어 필터링을 위해 InnoDB의 스토리지 엔진 계층으로 떨어지므로 테이블 반환과 레코드를 MySQL 서버 계층으로 반환하는 상호 작용 오버헤드가 줄어들고 성능이 향상됩니다. SQL의 실행 효율성.
첫 번째는 count()입니다. 이때 와일드카드 *는 최적화 후 모든 열을 확장하지 않습니다. 실제로는 모든 열이 무시되고 행 수가 늘어납니다. 직접 계산했습니다. 따라서 행 개수만 수집하고 싶다면 count()를 사용하는 것이 가장 좋습니다.
다음으로 where 문을 분석합니다. 이 느린 쿼리는 위의 where 조건 쿼리의 실행 과정에 따라 보조 인덱스 idx_date_station_driver
를 사용한다고 가정합니다. 느린 쿼리의 Index First Key는 start_date>'1628442000'이고 Index Last Key는 is: start_dateidx_date_station_driver,按照上面where条件查询的执行过程,该慢查询的Index First Key为start_date>'1628442000',Index Last Key为: start_date
提取Index First Key后在索引B+树上定位索引起始范围就是索引匹配的过程,在索引B+树上使用二分搜索方法快速定位符合查询条件的起始叶子节点。通过上文Where条件查询执行过程,我们知道该慢查询的where条件(start_date>'1628442000' and start_date,只匹配了索引<code>idx_date_station_driver(start_date, station_id, driver_id)
的第一个字段,即只匹配了idx_date_station_driver(start_date)
,station_id='1809‘精确查询并没有作用到匹配索引上,而是在Index Filter即索引下推过程中发挥了作用。实际上这里是因为范围查询使联合索引停止匹配。
为什么范围查询会使联合索引停止匹配?这里涉及到最左前缀匹配原理。假设建立一个联合索引 index(a, b),会先对a进行排序,在a相等的情况下对b进行排序,如下图所示。在该索引树上,a是全局有序的,而b则处于全局无序、局部有序状态。从全局来看,b的值为1、2、1、4、1、2,只有 b=2
查询条件无法直接使用该索引;从局部来看,当a的值确定时,b则是有序状态,a=2 && b=4
Index First Key를 추출한 후, 인덱스 B+ 트리에서 인덱스의 시작 범위를 찾는 것이 인덱스 매칭 과정입니다
(start_date>'1628442000' and start_date의 where 조건을 알 수 있습니다. , 인덱스 <code>idx_date_station_driver(start_date, station_id,driver_id)
의 첫 번째 필드만 일치합니다. 즉, idx_date_station_driver(start_date)
만 일치합니다. station_id=의 정확한 쿼리입니다. '1809'는 일치하는 인덱스에 대해서는 동작하지 않지만, Index Filter, 즉 인덱스 푸시다운 과정에서 역할을 합니다. 여기서 실제로 일어나는 일은 범위 쿼리로 인해 통합 인덱스 일치가 중단된다는 것입니다 .
범위 쿼리로 인해 결합 인덱스 일치가 중지됨
범위 쿼리는 조인트 인덱스의 일치를 중지하고 인덱스가 일치할 때 station_id가 '1809'와 같지 않은 데이터를 필터링할 수 없으므로 인덱스의 Mysql의 검색 범위 Index First Key 및 Index Last Key가 start_timestamp_of_date에 의해 완전히 결정됩니다. 시간이 결정합니다. start_timestamp_of_date 범위 쿼리는 데이터 볼륨의 73%를 필터링할 수 있는 반면 station_id='1809' 정확한 쿼리는 데이터 볼륨의 99%를 필터링할 수 있습니다. | ||
---|---|---|
비율 | ||
6,367만 | 100% | |
27.35% |
상태 필드가 인덱스 idx_date_station_driver
필드에 없기 때문에 인덱스로 필터링된 데이터를 쿼리하려면 테이블을 반환해야 하며, 데이터가 MySQL 서비스 계층의 쿼리 조건을 충족합니다. idx_date_station_driver
字段上,所以需要回表查询索引过滤的数据,在Mysql服务层判数据是否符合查询条件。
Mysql的优化器在执行sql语句时会先估算走匹配度高的索引的开销,如果走索引的开销比查全表还大,那么Mysql会选择全表扫描。这个结论可能反常识,在我们印象中索引就是用来提高查询效率的。这里主要涉及两个因素:
当查询条件或查找的字段不在二级索引的字段上时,会执行回表操作,会走:二级索引+主键索引。
磁盘随机I/O的性能低于顺序I/O。回表查询在主键索引上是随机I/O,全表扫描在主键索引上是顺序I/O。
做实验分析回表操作的开销是否是索引失效的直接原因?
去除status='0'查询条件,explain查看该查询是否使用到了索引idx_date_station_driver
디스크 랜덤 I/O의 성능은 순차 I/O보다 낮습니다. 테이블 반환 쿼리는 기본 키 인덱스에 대한 무작위 I/O이고, 전체 테이블 스캔은 기본 키 인덱스에 대한 순차 I/O입니다.
status='0' 쿼리 조건을 제거하고 쿼리가 idx_date_station_driver
인덱스를 사용하는지 설명하세요. 결과는 아래 그림과 같습니다. 테이블 반환 작업의 오버헤드가 줄어들고 인덱스가 무효화되지 않습니다.
요약
가
idx_station_date_driver(station_id, start_date,driver_id)Extension
인덱스 오류의 일반적인 시나리오
group by는 가장 왼쪽 일치 원칙을 위반하고 인덱스가 아닌 필드 그룹화를 포함하므로 임시 테이블이 생성됩니다. |
Explain 분석 |
||
---|---|---|---|
Type | |||
ALL | |||
ql 서비스 레이어 사용 | index | 인덱스 트리 전체 스캔 | |
를 사용하면 스토리지 엔진 계층에서 데이터를 가져오고 where 쿼리 조건을 사용하여 Mysql 서비스 계층의 데이터를 필터링합니다. | range | 인덱스 트리 범위 스캔 | |
인덱스 범위 스캔. 인덱스 스캔은 전체 테이블 스캔과 유사하지만 서로 다른 수준에서 발생합니다. | ref | 고유 인덱스의 고유하지 않은 인덱스 및 고유하지 않은 접두사와 같은 고유하지 않은 인덱스 스캔 | |
인덱스 푸시다운을 사용하여 쿼리 인덱스 필드를 최대한 활용하여 스토리지 엔진 레이어 | eq_ref | 고유 인덱스, 기본 키 인덱스와 같은 고유 인덱스 스캔 | |
임시 테이블은 쿼리 정렬 및 그룹화에 사용되는 결과를 저장합니다 | const | 쿼리를 상수로 변환 |
위 내용은 Mysql 인덱스가 실패하면 어떻게 해야 합니까? 실패 원인에 대한 간략한 분석의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!