mysql 인덱스의 기본 구현 원리-MySQL 튜토리얼-php.cn

집

데이터 베이스

MySQL 튜토리얼

mysql 인덱스의 기본 구현 원리

无忌哥哥

Jul 12, 2018 am 10:14 AM

MySQL 인덱스의 데이터 구조와 알고리즘 원리

1. 정의

인덱스 정의: 인덱스(Index)는 MySQL이 데이터를 효율적으로 얻을 수 있도록 도와주는 데이터 구조입니다.
본질: 인덱스는 데이터 구조입니다.

2. B-Tree

m-order B-Tree는 다음 조건을 만족합니다.
1. 각 노드는 최대 m개의 하위 트리를 가질 수 있습니다.
2. 루트 노드에는 노드가 2개 이상 있습니다(또는 극단적인 경우 트리에는 루트 노드가 하나만 있습니다. 단일 세포 유기체는 뿌리, 잎 및 나무입니다).
3. 비루트 및 비리프 노드에는 최소한 Ceil(m/2) 하위 트리가 있어야 합니다(Ceil은 5차 B-트리와 같이 반올림을 의미하며 각 노드에는 최소한 3개의 하위 트리가 있습니다. 최소 3개의 포크).
4. 리프가 아닌 노드의 정보에는 [n,A0,K1,A1,K2,A2,...,Kn,An]이 포함됩니다. 여기서 n은 노드에 저장된 키워드 수를 나타내고, K는 키워드를 나타냅니다. Ki5. 루트에서 잎까지의 각 경로는 동일합니다(리프 노드는 동일한 레이어에 있음).

B-트리 기능:

1. 키워드 세트는 트리 전체에 분산됩니다. 모든 키워드는 하나의 노드에만 나타납니다.
4. 노드의 키는 왼쪽에서 오른쪽으로 감소합니다. ;
6. 모든 리프 노드는 트리 높이 h와 동일한 깊이를 갖습니다.

B-Tree의 검색 알고리즘의 의사 코드는 다음과 같습니다.

3. B+Tree

B+Tree와 B-Tree의 차이점은 다음과 같습니다. 1. 트리가 아닌 노드는 데이터를 저장하지 않으며

2. 모든 키워드는 리프 노드에 저장됩니다.

3. 각 리프 노드에는 인접한 리프 노드에 대한 포인터가 포함되어 있으며 순차 액세스 포인터가 있는 B+ 트리는 간격 검색을 향상시킵니다. ;
4. 리프가 아닌 노드는 인덱스 부분으로 간주될 수 있으며 해당 노드는 하위 트리(루트 노드)에서 가장 큰(또는 가장 작은) 키워드만 포함합니다.

4. 트리 인덱스

기본: 디스크 I/O 수를 사용하여 인덱스 구조의 품질을 평가합니다.메인 메모리와 디스크는 페이지 단위로 데이터를 교환합니다. 노드의 크기를 한 페이지와 동일하게 설정합니다. 완전히 로드된 I/O가 하나만 필요합니다.

B-트리의 정의에 따르면 검색은 한 번에 최대 h개의 노드에 액세스해야 함을 알 수 있습니다.

점근적 복잡성: O(h)=O(logdN)
dmax=floor(pagesize/(keysize+ datasize+pointsize))
일반적인 실제 응용에서 out-degree d는 매우 큰 수(보통 100 이상)이므로 h는 매우 작습니다(보통 3을 넘지 않으며 레이어 3은 약 백만 개의 데이터를 저장할 수 있습니다)
B-트리에서 검색하려면 최대 h-1 I/O가 필요합니다(루트 노드는 메모리에 상주합니다)
B+트리의 노드에는 데이터 필드가 포함되어 있지 않으므로 아웃 차수 d가 더 크고 h가 더 작습니다. , I/O 수가 적고 효율성이 높기 때문에 외부 메모리 인덱스에는 B+Tree가 더 적합합니다.

5. MySQL 인덱스 구현

1. MyISAM 엔진은 B+Tree를 인덱스 구조로 사용합니다. 리프 노드의 데이터 필드는 데이터 레코드의 주소를 저장합니다. MyISAM 기본 인덱스 간에는 구조적 차이가 없습니다. 보조 인덱스는 키가 고유해야 하지만 보조 인덱스의 키는 반복될 수 있습니다.
2. InnoDB 데이터 파일 자체는 인덱스 파일이며 리프 노드에는 완전한 데이터 레코드가 포함됩니다. 인덱스를 클러스터형 인덱스라고 합니다.
InnoDB의 데이터 파일 자체는 기본 키로 집계되기 때문에 InnoDB에서는 테이블에 기본 키가 있어야 합니다(MyISAM에는 기본 키가 필요하지 않음). 명시적으로 지정하지 않으면 MySQL 시스템은 데이터 레코드를 고유하게 식별할 수 있는 열을 자동으로 선택합니다. 그렇지 않은 경우 MySQL 시스템은 데이터 레코드를 기본 키로 고유하게 식별할 수 있는 열을 자동으로 선택합니다. 이러한 열이 있으면 MySQL은 자동으로 InnoDB 테이블의 기본 키로 암시적 필드를 생성합니다.

InnoDB의 보조 인덱스 데이터 필드는 주소 대신 해당 레코드의 기본 키 값을 저장합니다.

보조 인덱스 검색은 인덱스를 두 번 검색해야 합니다. 먼저 기본 키를 얻기 위해 보조 인덱스를 검색한 다음 기본 키를 사용합니다.

3. 페이지 분할 문제

기본 키가 단조롭게 증가하면 페이지가 채워지면 각각의 새 레코드가 페이지에 계속 삽입됩니다.

쓰기가 잘못된 경우 InnoDB는 새 행에 공간을 할당하기 위해 페이지 분할을 자주 수행할 수 없습니다. 페이지 분할로 인해 많은 양의 데이터가 이동됩니다. 삽입하려면 하나가 아닌 세 개 이상의 페이지를 수정해야 합니다.

페이지 분할이 자주 발생하면 페이지가 희박해지고 불규칙하게 채워져 결국 데이터가 조각나게 됩니다.

6. 요약

다양한 스토리지 엔진의 인덱스 구현 방법을 이해하는 것은 인덱스의 올바른 사용 및 최적화에 매우 도움이 됩니다.

1. 지나치게 긴 필드를 기본 키로 사용하지 않는 이유는 무엇입니까?

2. 자동 증가 필드를 기본 키로 선택하는 이유는 무엇입니까?

3. 자주 업데이트되는 필드를 색인화하는 것이 권장되지 않는 이유는 무엇입니까?

4. 차별화도가 높은 열을 인덱스로 선택하는 이유는 무엇인가요? 구별 공식은 count(distinct col)/count(*)

5입니다. 가능한 한 포함 인덱스를 사용하세요

7. LIMIT 페이징 쿼리 최적화

SELECT * FROM table  where condition LIMIT offset , rows ;

위 SQL 문의 구현 메커니즘은 다음과 같습니다.
1. "테이블" 테이블에서 오프셋+행 행 레코드를 읽습니다.
2. 이전 오프셋 행 레코드를 버리고 다음 행 행 레코드를 최종 결과로 반환합니다.
대상 인덱스:

select  a.id, sid, parent_s_id from cashpool_account_relationship a join (select id from cashpool_account_relationship LIMIT 1000000,10)b on a.id = b.id;
select  id, sid, parent_s_id from cashpool_account_relationship where id >=(select id from cashpool_account_relationship LIMIT 1000000,1) LIMIT 10;

8. Q&A

1. InnoDB는 해시 인덱스를 지원하나요? --Ma Xin
InnoDB는 해시 인덱스를 지원하지만 지원하는 해시 인덱스는 적응형입니다. InnoDB 스토리지 엔진은 테이블 사용량을 기반으로 테이블에 대한 해시 인덱스를 자동으로 생성하며 사람의 개입으로 해시를 생성하는 것이 허용되지 않습니다. 테이블의 인덱스.
2. InnoDB 기본 키 인덱스의 리프 노드에는 완전한 데이터 레코드가 포함되어 있습니다. 기본 키 인덱스 파일이 데이터 파일보다 큽니까? --Xu Caihou
1) Innodb 엔진에서 기본 키 인덱스의 리프 노드에는 레코드 데이터가 포함되며 기본 키 인덱스 파일은 데이터 파일입니다.
2) tables 테이블에서 계산되는 data_length는 기본 키 인덱스의 크기이고, index_length는 이 테이블에 있는 모든 보조 인덱스(보조 인덱스)의 계산된 크기입니다.

위 내용은 mysql 인덱스의 기본 구현 원리의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

관련 기사

산성 특성 (원자력, 일관성, 분리, 내구성)을 설명하십시오.Apr 16, 2025 am 12:20 AM

산성 속성에는 원자력, 일관성, 분리 및 내구성이 포함되며 데이터베이스 설계의 초석입니다. 1. 원자력은 거래가 완전히 성공적이거나 완전히 실패하도록합니다. 2. 일관성은 거래 전후에 데이터베이스가 일관성을 유지하도록합니다. 3. 격리는 거래가 서로를 방해하지 않도록합니다. 4. 지속성은 거래 제출 후 데이터가 영구적으로 저장되도록합니다.

MySQL : 데이터베이스 관리 시스템 대 프로그래밍 언어Apr 16, 2025 am 12:19 AM

MySQL은 데이터베이스 관리 시스템 (DBMS) 일뿐 만 아니라 프로그래밍 언어와 밀접한 관련이 있습니다. 1) DBMS로서 MySQL은 데이터를 저장, 구성 및 검색하는 데 사용되며 인덱스 최적화는 쿼리 성능을 향상시킬 수 있습니다. 2) SQL과 같은 ORM 도구를 사용하여 Python에 내장 된 SQL과 프로그래밍 언어를 결합하면 작업을 단순화 할 수 있습니다. 3) 성능 최적화에는 인덱싱, 쿼리, 캐싱, 라이브러리 및 테이블 부서 및 거래 관리가 포함됩니다.

MySQL : SQL 명령으로 데이터 관리Apr 16, 2025 am 12:19 AM

MySQL은 SQL 명령을 사용하여 데이터를 관리합니다. 1. 기본 명령에는 선택, 삽입, 업데이트 및 삭제가 포함됩니다. 2. 고급 사용에는 조인, 하위 쿼리 및 집계 함수가 포함됩니다. 3. 일반적인 오류에는 구문, 논리 및 성능 문제가 포함됩니다. 4. 최적화 팁에는 인덱스 사용, 선택*을 피하고 한계 사용이 포함됩니다.

MySQL의 목적 : 데이터를 효과적으로 저장하고 관리합니다Apr 16, 2025 am 12:16 AM

MySQL은 데이터 저장 및 관리에 적합한 효율적인 관계형 데이터베이스 관리 시스템입니다. 장점에는 고성능 쿼리, 유연한 트랜잭션 처리 및 풍부한 데이터 유형이 포함됩니다. 실제 애플리케이션에서 MySQL은 종종 전자 상거래 플랫폼, 소셜 네트워크 및 컨텐츠 관리 시스템에서 사용되지만 성능 최적화, 데이터 보안 및 확장성에주의를 기울여야합니다.

SQL 및 MySQL : 관계 이해Apr 16, 2025 am 12:14 AM

SQL과 MySQL의 관계는 표준 언어와 특정 구현의 관계입니다. 1.SQL은 관계형 데이터베이스를 관리하고 운영하는 데 사용되는 표준 언어로, 데이터 추가, 삭제, 수정 및 쿼리를 허용합니다. 2.MySQL은 SQL을 운영 언어로 사용하고 효율적인 데이터 저장 및 관리를 제공하는 특정 데이터베이스 관리 시스템입니다.

InnoDB Redo Logs 및 Undo Logs의 역할을 설명하십시오.Apr 15, 2025 am 12:16 AM

InnoDB는 Redologs 및 Undologs를 사용하여 데이터 일관성과 신뢰성을 보장합니다. 1. Redologs는 사고 복구 및 거래 지속성을 보장하기 위해 데이터 페이지 수정을 기록합니다. 2. 결점은 원래 데이터 값을 기록하고 트랜잭션 롤백 및 MVCC를 지원합니다.

설명 출력 (유형, 키, 행, 추가)에서 찾아야 할 주요 메트릭은 무엇입니까?Apr 15, 2025 am 12:15 AM

설명 명령에 대한 주요 메트릭에는 유형, 키, 행 및 추가가 포함됩니다. 1) 유형은 쿼리의 액세스 유형을 반영합니다. 값이 높을수록 Const와 같은 효율이 높아집니다. 2) 키는 사용 된 인덱스를 표시하고 NULL은 인덱스가 없음을 나타냅니다. 3) 행은 스캔 한 행의 수를 추정하여 쿼리 성능에 영향을 미칩니다. 4) Extra는 최적화해야한다는 Filesort 프롬프트 사용과 같은 추가 정보를 제공합니다.

설명에서 임시 상태를 사용하고 피하는 방법은 무엇입니까?Apr 15, 2025 am 12:14 AM

Temporary를 사용하면 MySQL 쿼리에 임시 테이블을 생성해야 할 필요성이 있으며, 이는 별개의, 그룹 비 또는 비 인덱스 열을 사용하여 순서대로 발견됩니다. 인덱스 발생을 피하고 쿼리를 다시 작성하고 쿼리 성능을 향상시킬 수 있습니다. 구체적으로, 설명 출력에 사용되는 경우, MySQL은 쿼리를 처리하기 위해 임시 테이블을 만들어야 함을 의미합니다. 이것은 일반적으로 다음과 같은 경우에 발생합니다. 1) 별개 또는 그룹을 사용할 때 중복 제거 또는 그룹화; 2) OrderBy가 비 인덱스 열이 포함되어있을 때 정렬하십시오. 3) 복잡한 하위 쿼리 또는 조인 작업을 사용하십시오. 최적화 방법은 다음과 같습니다. 1) Orderby 및 GroupB

See all articles

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

mPDF

mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.

Eclipse용 SAP NetWeaver 서버 어댑터

Eclipse를 SAP NetWeaver 애플리케이션 서버와 통합합니다.

WebStorm Mac 버전

유용한 JavaScript 개발 도구

MinGW - Windows용 미니멀리스트 GNU

이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.