>  기사  >  데이터 베이스  >  MySQL에서 문자열에 효율적인 인덱스를 추가하는 방법

MySQL에서 문자열에 효율적인 인덱스를 추가하는 방법

王林
王林앞으로
2023-05-28 21:04:30884검색

요구 사항

일상적인 요구 사항에서 사용자가 휴대폰 번호나 이메일 주소를 사용하여 시스템에 로그인하는 것은 매우 일반적인 작업입니다. 그렇다면 휴대폰 번호나 이메일 주소와 같은 필드에 대한 합리적인 색인을 설정하는 방법은 무엇일까요?

Prefix index

Prefix index는 필드 값의 일부를 인덱스로 사용합니다. MySQL에서 인덱스를 생성할 때 인덱스 필드의 길이를 지정하지 않으면 전체 문자열이 인덱스 생성에 사용됩니다.

语句1:
alter table test add index idx(email);
语句2:
alter table test add index idx(email(8));

문 1의 경우 생성된 색인에는 각 레코드의 전체 이메일 문자열 값이 포함됩니다.

문 2의 경우 생성된 인덱스는 각 레코드에 있는 이메일 필드의 처음 8바이트를 저장합니다.

접두사 인덱스를 사용하면 인덱스가 더 적은 공간을 차지하고 전체 인덱스 트리가 더 컴팩트하며 트리 높이가 상대적으로 낮아진다는 장점이 있습니다.

그러나 이에 따라 인덱스 판별력이 낮아지고 이로 인해 인덱스 스캔 행 수가 증가할 수 있습니다.

우리가 인덱스를 생성할 때 인덱스의 구별은 매우 중요한 지표입니다. 해상도가 높을수록 중복 값이 ​​줄어들고 스캔 효율이 높아집니다.

접두사 인덱스의 길이를 적절하게 계획하면 공간을 절약할 수 있을 뿐만 아니라 추가 행을 스캔할 필요도 없습니다. 사용할 특정 길이는 실제 비즈니스 시나리오를 기반으로 판단하고 테스트하는 것이 좋습니다.

역순 + 접두사 색인

역순 + 접두사 색인에는 ID 번호를 색인화하는 고전적인 사용 시나리오가 있습니다.

이제 ID 번호로 쿼리하는 빈도가 높은 도시나 카운티에 있는 모든 사람의 신원 정보를 유지하려고 한다고 가정해 보겠습니다.

ID번호는 총 15자리 또는 18자리입니다. 일반적으로 같은 시, 군에 거주하는 사람들의 ID번호 앞 6자리는 전체를 직접 색인화하면 낭비가 됩니다. 공간이 부족해 성능이 저하됩니다. 직접 접두어 인덱스를 사용하는 경우 대부분의 값이 동일한 처음 6비트를 갖기 때문에 처음 6비트에는 차별이 거의 없거나 전혀 없습니다.

이때 역순 + 접두사 인덱스 사용 시 이점이 반영됩니다.

먼저 ID 카드를 역순으로 저장하거나, 중복된 ID 카드 번호 필드를 역순으로 만든 후 처음 6자리를 접두사 인덱스로 사용합니다.

신분증 마지막 6자리의 구분은 기본적으로 충분합니다. 여전히 쿼리 속도가 충분하지 않다고 생각되면 처음 8자리를 사용해도 문제가 없습니다.

위 내용은 MySQL에서 문자열에 효율적인 인덱스를 추가하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 yisu.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제