1. 文字セットの概念
文字セットは、コードと文字の対応関係を標準化し、コンピュータ文字の符号化方式を規定します。異なるデータベース システムでは文字セット設定が異なる場合があり、異なる文字セットには独自の特性と利点があります。 Latin1/Latin7 と比較して、GB2312/GBK/GB18030 は漢字の処理において大きな利点があります。
MySQL では、文字セットとは、データベース、テーブル、列などの文字データをエンコードする方法を指します。平たく言えば、文字セットとは、文字と文字列を保存および処理するために使用される方法を指します。
MySQL でサポートされている文字セットには、主に ASCII、GBK、GB2312、UTF-8、UTF-16、ISO-8859 などが含まれます。その中で、UTF-8 が最もよく使用される文字セットです。 MySQL では、複数の言語をサポートし、柔軟なエンコード形式を備え、スペースを節約し、その他の利点があるためです。
2. MySQL キャラクタ セットの設定方法
MySQL でサポートされているキャラクタ セットをクエリします。
MySQL データベース内ででは、次のコマンドを使用して、データベースでサポートされている文字セットをクエリできます:
SHOW CHARACTER SET;
このコマンドでは、MySQL で使用できるさまざまな文字セットを一覧表示できます。例:
Charset | Description | デフォルトの照合順序 | Maxlen |
---|---|---|---|
big5 | Big5 繁体字中国語 | big5_chinese_ci | 2 |
#dec8 | DEC 西ヨーロッパ | dec8_swedish_ci | 1 |
cp850 | DOS 西ヨーロッパ | cp850_general_ci | 1 |
hp8 | HP 西ヨーロッパ | hp8_english_ci | 1 |
koi8r | KOI8-R Relcom ロシア語 | koi8r_general_ci | 1 |
latin1 | iso-8859-1 西ヨーロッパ | latin1_swedish_ci | 1 |
latin2 | iso-8859-2 中央ヨーロッパ | latin2_general_ci | 1 |
7 ビット スウェーデン語 | swe7_swedish_ci | 1 | |
US ASCII | ascii_general_ci | 1 | |
EUC-JP 日本語 | ujis_japanese_ci | 3 | |
シフト JIS 日本語 | sjis_japanese_ci | 2 | |
iso-8859-8 Hebrew | hebrew_general_ci | 1 | |
TIS620 タイ語 | tis620_thai_ci | 1 | |
EUC-KR 韓国語 | euckr_korean_ci | 2 | |
KOI8-U ウクライナ語 | koi8u_general_ci | 1 | |
GB2312 簡体字中国語 | gb2312_chinese_ci | 2 | |
iso-8859 - 7 ギリシャ語 | greek_general_ci | 1 | |
Windows Central European | cp1250_general_ci | 1 | |
GBK 簡体字中国語 | gbk_chinese_ci | 2 | |
iso-8859-9 トルコ語 | latin5_turkish_ci | 1 | #armscii8 |
armscii8_general_ci | 1 | utf8 | |
utf8_general_ci | 3 | ##ucs2 | |
ucs2_general_ci | 2 | cp866 | |
cp866_general_ci | 1 | ##keybcs2 | DOS カメニッキー チェコ語-スロバキア語 |
1 | macce | Mac 中央ヨーロッパ | |
1 | macroman | Mac West European | |
1 | cp852 | DOS中央ヨーロッパ | |
1 | latin7 | iso-8859-13 バルト海 | |
1 | utf8mb4 | UTF-8 Unicode | |
4 | cp1251 | Windows キリル文字 | |
1 | #utf16 | UTF -16 Unicode | |
4 | utf16le | UTF-16LE Unicode | |
4 | cp1256 | Windows アラビア語 | |
1 | # #cp1257 | Windows Baltic | |
1 | ##utf32 | UTF-32 Unicode | utf32_general_ci |
binary | バイナリ擬似文字セット | #binary | |
geostd8 | GEOSTD8 グルジア語 | geostd8_general_ci | |
cp932 | SJIS for Windows 日本語 | cp932_japanese_ci | |
eucjpms | UJIS for Windows 日本語 | eucjpms_japanese_ci | |
以上がmysqlで文字セットを設定する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。