이 기사에서는 MySQL 문자 집합이 무엇인지에 대해 소개합니다. 도움이 필요한 친구들이 참고할 수 있기를 바랍니다.
문자 집합 소개
gbk/gb2312
gbk/gb2312
에서는 중국어와 영어 문자를 모두 이중 문자로 표현합니다. , 최상위 비트는 1로 설정
gb2312는 gbk의 하위 집합, gbk는 gb18030의 하위 집합, gb2312는 중국어 간체 문자만 저장할 수 있습니다. gbk는 중국어, 일본어, 한국어 문자를 포함하는 큰 문자 집합입니다
보통 gbk 문자를 사용합니다. set이면 충분
International 범용성은 utf8보다 떨어지지만 utf8이 차지하는 데이터베이스는 gbk보다 큽니다(utf8은 3바이트 문자 집합입니다)
utf8/utf8mb4
UTF 전체 이름(유니코드 변환 형식), 유니코드 저장 방법, 유니코드라고도 함UTF8은 가변 길이 바이트를 사용하여 유니코드 문자를 저장합니다. 예를 들어 ASCII 문자는 계속 1바이트를 사용하여 저장하고, 악센트 문자, 그리스 문자 또는 키릴 문자는 2바이트를 사용하여 저장하는 반면 일반적으로 사용되는 중국어 문자는 3바이트를 사용합니다. , 영어 문자 1개는 단어 1개에 해당하고, 한자 1개(중국어 번체 포함)는 3바이트에 해당합니다.
utf8mb4는 문자당 최대 4바이트를 저장할 수 있으므로 더 많은 문자 집합을 지원할 수 있습니다. utf8mb4는 이모티콘 표현을 저장하는 프로젝트에서 일반적으로 사용됩니다.
latin1은 8비트(1바이트) 문자 집합이지만 아시아 및 아프리카 언어를 포함할 수 없습니다.
unidoce는 latin1의 확장으로 일반 아시아 및 아프리카 언어에 대한 지원이 추가되지만 여전히 모든 언어를 지원하지는 않으며 unidoce를 사용하여 ASCII를 표현하는 것은 효율적이지 않습니다(작은 문자 세트를 큰 문자 세트로 변환하는 경우가 많습니다).
UTF8은 유니코드의 확장입니다.
gbk, gb2312 및 UTF8과 같은 문자 세트는 유니코드 인코딩을 통해 서로 변환되어야 합니다.
문자 세트 사용 제안1. 확실히 중국 단말기 사용자만 있는 경우 gbk / gb2312
2를 선택하면 데이터 마이그레이션 및 다중 단말기 표시가 가능합니다. , utf8을 사용하는 것이 가장 좋습니다
3. 문자가 대소문자를 구분할 필요가 없는 경우 기본 xx_ci 검사 세트를 사용할 수 있습니다. 그렇지 않으면 xx_bin 검사 세트를 선택합니다(프로덕션 환경에서는 검사를 수정하지 마십시오. set)
4. 기본 문자 집합은 latin1입니다. 이 문자 집합은 한자가 별도로 저장되므로 검색 결과가 충분히 정확하지 않습니다.
를 사용하지 않는 것이 좋습니다. MySQL 문자 집합 범위
서버 계층(서버) > 데이터베이스(데이터베이스) > 데이터 테이블(테이블) > 필드(열) > 연결(연결) | MySQL 문자 집합 우선순위Connection(연결) | 결과 집합(결과) > 필드(열) > 데이터 테이블(테이블) > 서버 계층(서버) char type
char(N): N은 바이트가 아닌 문자 수(문자 길이라고도 함)를 나타냅니다.char(N): 고정 길이 저장소로 고정 길이 저장 공간을 차지하며, 부족한 부분은 공백으로 채워집니다. MySQL이 char(N) 유형을 처리할 때 공백을 제거하고 반환해야 합니다.
저장 공간: char(N) 유형의 저장 공간은 현재 문자 세트의 지식 포인트와 결합하여 utf8 문자 세트에서 중국어는 3바이트를 차지하고 gbk는 2바이트를 차지합니다. 숫자와 문자는 하나의 문자 표현을 사용합니다.저장 메커니즘: 길이가 충분하지 않으면 MySQL은 데이터를 저장할 때 16진수 20 대신 특수 공간을 채워야 합니다.
생각:char(30), 다른 문자 집합으로 최대 30자를 저장할 수 있습니다. 문자, 한자, 점유 공간gbk: 30바이트를 저장할 수 있고 공간을 차지합니다. 30*2utf8: 30바이트를 저장할 수 있고 공간을 차지합니다. 30*3
varcahr 유형varchar(N): N 바이트가 아닌 문자 수(문자 길이라고도 함)를 나타냅니다.
varchar(N): 필요한 저장 공간만 사용하는 가변 길이 저장소입니다. 저장 공간: varchar(N) 유형 저장 공간은 다음과 관련이 있습니다. 지금까지의 문자 집합의 지식 포인트를 종합하면 utf8 문자 집합에서 한자는 3바이트를 차지하고, gbk는 2바이트를 균일하게 1개의 문자로 표현합니다.저장 메커니즘: varchar(N) 필드 저장은 실제로 두 번째 바이트부터 시작하여 1~2바이트를 사용하여 실제 길이를 나타냅니다. 나머지는 데이터를 저장할 수 있는 범위이므로 사용 가능한 최대 저장 범위는 65535-입니다. 3=65532바이트; 첫 번째 바이트는 비어 있는지 여부를 식별합니다. (길이가 255바이트 미만인 경우 1바이트를 사용하여 길이를 나타냅니다. 255바이트보다 크면 2바이트를 사용하여 길이를 나타냅니다.)
데이터베이스 인스턴스 문자 집합 수정일시적으로 적용
mysql> set character_set = 'gbk'; mysql> set character_set_client = 'gbk';
전역적으로 적용
mysql> set global character_set_client = 'gbk'; Query OK, 0 rows affected (0.00 sec)
영구적으로 적용
vim /etc/my.cnf character-set-server=utf8
요약: 위 내용은 이 글의 전체 내용입니다. 모든 분들의 학습에 도움이 되기를 바랍니다. 더 많은 관련 튜토리얼을 보려면
mysql 데이터베이스 그래픽 튜토리얼, MySQL 비디오 튜토리얼, bootstrap 비디오 튜토리얼을 방문하세요!
위 내용은 MySQL 문자 집합이란 무엇입니까? 문자 집합 소개의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!