>  기사  >  데이터 베이스  >  데이터베이스 기본 키 ID 생성 전략

데이터베이스 기본 키 ID 생성 전략

藏色散人
藏色散人앞으로
2019-08-15 14:21:303522검색

머리말:  

고유 시스템 ID는 시스템을 설계할 때 자주 직면하는 문제입니다. 다음은 몇 가지 일반적인 ID 생성 전략입니다.

● 시퀀스 ID

● UUID

● GUID

● COMB

● Snowflake

초기 자동 증가 ID는 별도의 데이터베이스 요구 사항을 충족하는 데 사용됩니다. 자동 증가를 전제로 다른 시작점이 사용되지만 데이터베이스 확장이 필요한 경우 매우 번거롭습니다. . 예를 들어, 특정 시스템의 데이터베이스를 처음 설계할 때 데이터베이스에 10개의 테이블이 있을 것입니다. 그러면 각 테이블의 내용에 대해 서로 다른 ID가 필요합니다. 예를 들어 첫 번째 테이블과 같이 증가하지 않는 형식을 사용할 수 있습니다. 1, 11, 21, 31입니다. . . 두 번째 테이블은 2, 12, 22, 32입니다. . . 세 번째 테이블은 3, 13, 23, 33입니다. . . 열 번째 테이블은 10, 20, 30입니다. . . 그런데 문제는 어느 날 이 시스템의 10개 테이블이 더 이상 충분하지 않아 다른 테이블을 추가하려는 경우 이때 기본 키를 어떻게 할당해야 합니까? 또한, 여러 데이터베이스의 데이터를 병합하고 싶지만 이렇게 간단한 ID 생성 방법의 경우 중복 가능성이 매우 높기 때문에 거의 확실하게 중복이 발생하게 됩니다. 분명히 이전 방법의 확장성은 좋지 않습니다.

자동 증가 ID에 비해 UUID는 고유한 기본 키를 생성하는 데 더 편리하지만(데이터 양이 매우 많을 경우 중복 가능성이 있음) UUID의 무질서로 인해 , 성능은 자동 증가 ID만큼 좋지 않으며 문자열 저장소는 저장 공간이 크고 쿼리 효율성이 낮습니다. Key: uuid 사용의 단점은 쿼리 효율성이 낮다는 것입니다! ​

COMB는 UUID에 비해 생성된 ID의 질서를 높이고 삽입 및 쿼리의 효율성을 향상시킵니다. 이 글은 간단한 분석을 담고 있습니다.

Sonwflake는 트위터의 기본 키 생성 전략으로, 128비트 문자열 대신 64비트 긴 정수를 사용하여 COMB를 개선한 것으로 볼 수 있습니다. ID의 구성은 동시성을 피하기 위한 첫 번째 0 + 41비트 시간 접두어 + 10비트 노드 식별 + 12비트 시퀀스 번호입니다.

파트 1: 시퀀스 ID


데이터베이스는 가장 일반적인 방법으로 시퀀스 또는 필드를 자동으로 늘립니다. 이는 데이터베이스에 의해 유지관리되며 데이터베이스에 고유합니다.

장점:

간단하고 편리한 코드, 만족스러운 성능.

번호ID가 자연스럽게 정렬되기 때문에 페이징이나 정렬이 필요한 결과에 매우 유용합니다.

단점:

데이터베이스마다 구문과 구현이 다르므로 데이터베이스 마이그레이션 중에 또는 여러 데이터베이스 버전을 지원할 때 처리해야 합니다.

단일 데이터베이스 또는 읽기-쓰기 분리 또는 하나의 마스터와 다중 슬레이브의 경우 하나의 마스터 데이터베이스만 생성할 수 있습니다. 단일 장애 지점이 발생할 위험이 있습니다.

성능이 요구 사항을 충족하지 못하는 경우 확장이 어렵습니다.

여러 시스템을 병합해야 하거나 데이터 마이그레이션이 필요한 경우 상당히 고통스러울 것입니다.

테이블과 데이터베이스를 분리할 때 문제가 발생합니다.

최적화 계획:

메인 라이브러리 단일 지점의 경우 마스터 라이브러리가 여러 개 있는 경우 각 마스터 라이브러리에 대해 설정되는 시작 번호가 다릅니다. , 단계 크기는 동일하며 마스터 수일 수 있습니다.

예: Master1은 1, 4, 7, 10을 생성하고 Master2는 2,5,8,11을 생성하고 Master3은 3,6,9,12를 생성합니다. 이는 클러스터에서 고유 ID를 효과적으로 생성하고 ID 생성 데이터베이스 작업에 대한 부하를 크게 줄입니다.

2부: UUID


npm 관리 https://www.npmjs.com/package/uuid #🎜 🎜 #

일반적인 방법은 128비트입니다. 이는 데이터베이스나 프로그램을 사용하여 생성될 수 있으며 일반적으로 전 세계적으로 고유합니다.

A UUID는 128비트 전역 고유 식별자이며 일반적으로 32바이트 문자열로 표시됩니다. GUID라고도 하는 시간과 공간의 고유성을 보장할 수 있습니다. 전체 이름은 UUID - Python에서 UUID라고 하는 Universally Unique IDentifier입니다.

MAC 주소, 타임스탬프, 네임스페이스, 난수, 의사 난수를 통해 생성된 ID의 고유성을 보장합니다.

UUID에는 크게 5가지 알고리즘, 즉 이를 구현하는 방법이 5가지 있습니다.

(1), uuid1()

- 타임스탬프 기준. MAC 주소, 현재 타임스탬프 및 임의의 숫자에서 생성됩니다. 글로벌 고유성은 보장되지만, MAC을 사용하면 LAN에서 MAC 대신 IP를 사용할 수도 있어 보안 문제도 발생합니다.

(2), uuid2()

분산 컴퓨팅 환경 DCE 기반(이 함수는 Python에 존재하지 않습니다). 알고리즘은 타임스탬프의 처음 4개 위치가 POSIX UID로 대체된다는 점을 제외하면 uuid1과 동일합니다. 이 방법은 실제로는 거의 사용되지 않습니다.

(3),uuid3()

이름 기반 MD5 해시 값입니다. 이는 이름과 네임스페이스의 MD5 해시 값을 계산하여 얻어지며, 동일한 네임스페이스에 있는 서로 다른 이름의 고유성과 서로 다른 네임스페이스의 고유성을 보장하지만, 동일한 네임스페이스에 있는 동일한 이름은 동일한 UUID를 생성합니다.

(4), uuid4()

난수 기준. 의사 난수로부터 얻은 특정 반복 확률이 있으며 이 확률을 계산할 수 있습니다.

(5),uuid5()

이름 기반 SHA-1 해시 값입니다. 알고리즘은 Secure Hash Algorithm 1 알고리즘이 사용된다는 점을 제외하면 uuid3과 동일합니다.

장점:

간단하고 코딩하기 쉽습니다.

세계 유일하게 데이터 마이그레이션, 시스템 데이터 병합, 데이터베이스 변경 등이 발생해도 침착하게 처리할 수 있습니다.

단점:

정렬이 없으며 추세가 증가한다고 보장할 수 없습니다.

UUID는 문자열을 사용하여 저장되는 경우가 많아 쿼리 효율성이 상대적으로 낮습니다.

저장 공간이 비교적 큽니다. 대용량 데이터베이스라면 저장 용량을 고려해야 합니다.

전송된 데이터의 양이 많습니다

읽을 수 없습니다.

최적화 솔루션:

읽을 수 없는 UUID 문제를 해결하려면 UUID를 Int64 방식으로 사용할 수 있습니다.

3부: GUID


GUID: Microsoft의 UUID 표준 구현입니다. GUID뿐만 아니라 다양한 UUID 구현이 있습니다. 장점과 단점은 UUID와 동일합니다.

4부: COMB


COMB(결합) 유형은 데이터베이스 고유의 디자인 아이디어로 GUID와 시스템 시간을 결합하여 색인 및 검색에 사용하는 것으로 이해할 수 있습니다. 성능이 더 좋습니다.

데이터베이스에는 COMB 유형이 없습니다. 이는 Jimmy Nilsson의 기사 "기본 키로서의 GUID 비용"에서 설계되었습니다.

COMB 데이터 유형의 기본 설계 아이디어는 다음과 같습니다. UniqueIdentifier 데이터는 불규칙성으로 인해 인덱싱 효율성이 낮아 시스템 성능에 영향을 미치므로 조합을 통해 UniqueIdentifier의 처음 10바이트를 유지할 수 있습니까? , 마지막 6바이트를 사용하여 GUID가 생성된 시간(DateTime)을 나타냅니다. 이를 통해 시간 정보를 UniqueIdentifier와 결합하여 UniqueIdentifier의 고유성을 유지하면서 질서를 높여 인덱싱 효율성을 향상시킵니다.

장점:

UUID 장애 문제를 해결하고 기본 키 생성 방식으로 Comb 알고리즘(guid/타임스탬프 결합)을 제공합니다. GUID의 10바이트를 예약하고 나머지 6바이트를 사용하여 GUID가 생성된 시간(DateTime)을 나타냅니다.

UUID보다 성능이 좋습니다.

5부: 트위터의 눈송이 알고리즘


snowflake는 트위터의 오픈소스 분산 ID 생성 알고리즘이며, 그 결과는 긴 ID입니다. 핵심 아이디어는 41비트를 밀리초 수로 사용하고, 10비트를 시스템 ID로 사용하고(5비트는 데이터 센터, 5비트는 시스템 ID), 12비트를 밀리초 내의 일련 번호로 사용하는 것입니다. 4096 ID 생성) 끝에는 항상 0인 부호 비트가 있습니다. 눈송이 알고리즘은 프로젝트의 필요에 따라 수정될 수 있습니다. 예를 들어, 향후 데이터 센터 수, 각 데이터 센터의 머신 수, 가능한 동시성 수를 통일된 밀리초 단위로 추정하여 알고리즘에 필요한 비트 수를 조정합니다.

장점:

은 데이터베이스에 의존하지 않고 유연하고 편리하며 데이터베이스보다 성능이 좋습니다.

단일 머신에서는 시간이 지남에 따라 ID가 증가합니다.

단점:

단일 머신에서는 증분식이지만 분산 환경으로 인해 각 머신의 시계를 완전히 동기화할 수 없으며 때로는 전역적으로 증분되지 않는 상황이 있을 수 있습니다.

6. 사용

사용하기 정말 편리합니다.

npm install uuid --save

그러면 사용할 수 있습니다!

  const uuidv1 = require(‘uuid/v1‘);
  console.log(‘随机uuid字符串‘, uuidv1());

이렇게 하면 uuid 문자열을 출력할 수 있습니다. 매번 다릅니다.

위 내용은 데이터베이스 기본 키 ID 생성 전략의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 learnku.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제