ホームページ  >  記事  >  データベース  >  mysql5.5で文字エンコーディングをクエリするにはどうすればよいですか?

mysql5.5で文字エンコーディングをクエリするにはどうすればよいですか?

青灯夜游
青灯夜游オリジナル
2020-10-16 10:22:392397ブラウズ

mysql5.5 では、「SHOW VARIABLES LIKE 'character%';」ステートメントを通じて文字エンコーディングをクエリでき、これにより、MySQL クライアントで使用される文字セット、接続時に使用される文字セットを表示できます。データベース、データベースの作成 使用する文字セット、データベース システムで使用する文字セットなど。

mysql5.5で文字エンコーディングをクエリするにはどうすればよいですか?

(推奨チュートリアル: mysql ビデオ チュートリアル )

文字 (Character) は、文字、数字、記号です。コンピュータ 文字の総称。文字には、漢字、英字、アラビア数字、句読点などが含まれます。

コンピュータはデータをバイナリ形式で保存します。私たちが普段ディスプレイに表示している数字、英語、句読点、漢字などの文字は、2進数に変換されたものです。

文字セット(Character set)は、文字とバイナリの対応を定義し、文字に固有の番号を割り当てます。一般的な文字セットには、ASCII、GBK、IOS-8859-1 などが含まれます。

文字コード(文字コード)は文字セットコードとも呼ばれ、文字番号をコンピュータに格納する方法を指定します。

ほとんどの文字セットは、ASCII、IOS-8859-1、GB2312、GBK などの 1 つの文字エンコーディングにのみ対応します。これらはすべて、文字セットと対応する文字エンコーディングの両方を表します。したがって、一般に、この 2 つは同義語と考えることができます。例外は Unicode 文字セットで、これには UTF-8、UTF-16、UTF-32 の 3 つのエンコード スキームがあります。最も一般的に使用されるエンコードは UTF-8 です。

MySQL では、SHOW VARIABLES LIKE 'character%'; コマンドを使用して、MySQL で現在使用されている文字セットを表示できます。コマンドと実行結果は次のとおりです。 ##

mysql> SHOW VARIABLES LIKE 'character%';
+--------------------------+---------------------------------------------------------+
| Variable_name            | Value                                                   |
+--------------------------+---------------------------------------------------------+
| character_set_client     | gbk                                                     |
| character_set_connection | gbk                                                     |
| character_set_database   | latin1                                                  |
| character_set_filesystem | binary                                                  |
| character_set_results    | gbk                                                     |
| character_set_server     | latin1                                                  |
| character_set_system     | utf8                                                    |
| character_sets_dir       | C:\Program Files\MySQL\MySQL Server 5.7\share\charsets\ |
+--------------------------+---------------------------------------------------------+
8 rows in set, 1 warning (0.01 sec)

上記の実行結果の説明を次の表に示します。

##名前##character_set_clientMySQL クライアントで使用される文字セット#データベースへの接続時に使用される文字セットデータベース システムで使用される文字セット。デフォルト値は utf8 で、設定は必要ありません。文字セットのインストール ディレクトリ#文字化けする場合は、character_set_filesystem、character_set_system、character_sets_dir を気にする必要はありません。文字化けに影響を与えない 3 つのシステム変数。
mysql> SHOW CHARACTER set;
+----------+---------------------------------+---------------------+--------+
| Charset  | Description                     | Default collation   | Maxlen |
+----------+---------------------------------+---------------------+--------+
| big5     | Big5 Traditional Chinese        | big5_chinese_ci     |      2 |
| dec8     | DEC West European               | dec8_swedish_ci     |      1 |
| cp850    | DOS West European               | cp850_general_ci    |      1 |
| hp8      | HP West European                | hp8_english_ci      |      1 |
| koi8r    | KOI8-R Relcom Russian           | koi8r_general_ci    |      1 |
| latin1   | cp1252 West European            | latin1_swedish_ci   |      1 |
| latin2   | ISO 8859-2 Central European     | latin2_general_ci   |      1 |
| swe7     | 7bit Swedish                    | swe7_swedish_ci     |      1 |
| ascii    | US ASCII                        | ascii_general_ci    |      1 |
| ujis     | EUC-JP Japanese                 | ujis_japanese_ci    |      3 |
| sjis     | Shift-JIS Japanese              | sjis_japanese_ci    |      2 |
| hebrew   | ISO 8859-8 Hebrew               | hebrew_general_ci   |      1 |
| tis620   | TIS620 Thai                     | tis620_thai_ci      |      1 |
| euckr    | EUC-KR Korean                   | euckr_korean_ci     |      2 |
| koi8u    | KOI8-U Ukrainian                | koi8u_general_ci    |      1 |
| gb2312   | GB2312 Simplified Chinese       | gb2312_chinese_ci   |      2 |
| greek    | ISO 8859-7 Greek                | greek_general_ci    |      1 |
| cp1250   | Windows Central European        | cp1250_general_ci   |      1 |
| gbk      | GBK Simplified Chinese          | gbk_chinese_ci      |      2 |
| latin5   | ISO 8859-9 Turkish              | latin5_turkish_ci   |      1 |
| armscii8 | ARMSCII-8 Armenian              | armscii8_general_ci |      1 |
| utf8     | UTF-8 Unicode                   | utf8_general_ci     |      3 |
| ucs2     | UCS-2 Unicode                   | ucs2_general_ci     |      2 |
| cp866    | DOS Russian                     | cp866_general_ci    |      1 |
| keybcs2  | DOS Kamenicky Czech-Slovak      | keybcs2_general_ci  |      1 |
| macce    | Mac Central European            | macce_general_ci    |      1 |
| macroman | Mac West European               | macroman_general_ci |      1 |
| cp852    | DOS Central European            | cp852_general_ci    |      1 |
| latin7   | ISO 8859-13 Baltic              | latin7_general_ci   |      1 |
| utf8mb4  | UTF-8 Unicode                   | utf8mb4_general_ci  |      4 |
| cp1251   | Windows Cyrillic                | cp1251_general_ci   |      1 |
| utf16    | UTF-16 Unicode                  | utf16_general_ci    |      4 |
| utf16le  | UTF-16LE Unicode                | utf16le_general_ci  |      4 |
| cp1256   | Windows Arabic                  | cp1256_general_ci   |      1 |
| cp1257   | Windows Baltic                  | cp1257_general_ci   |      1 |
| utf32    | UTF-32 Unicode                  | utf32_general_ci    |      4 |
| binary   | Binary pseudo charset           | binary              |      1 |
| geostd8  | GEOSTD8 Georgian                | geostd8_general_ci  |      1 |
| cp932    | SJIS for Windows Japanese       | cp932_japanese_ci   |      2 |
| eucjpms  | UJIS for Windows Japanese       | eucjpms_japanese_ci |      3 |
| gb18030  | China National Standard GB18030 | gb18030_chinese_ci  |      4 |
+----------+---------------------------------+---------------------+--------+
41 rows in set (0.02 sec)
説明
character_set_connection
#character_set_database データベースの作成に使用される文字セット
character_set_filesystem MySQL サーバー ファイルで使用される文字セットシステム、デフォルト値はバイナリで、変換は実行されません
character_set_results データベースがクライアントにデータを返すときに使用される文字セット
character_set_server MySQL サーバーによって使用されます文字セットはシステム自体によって管理されることをお勧めします。人為的に定義しないでください。
character_sets_dir
MySQL では、使用可能な文字セットを表示するためのコマンドと実行プロセスは次のとおりです: その中には:
最初の列 (Charset) は文字セット名、

2 番目の列 (Description) は文字セットの説明、

3 番目の列(デフォルトの照合順序) は文字セットのデフォルトの照合規則です;
  • 4 番目の列 (Maxlen) は、文字セット内の文字が占める最大バイト数を示します。
  • 一般的に使用される文字セットは次のとおりです:
  • latin1 は西ヨーロッパ文字、ギリシャ文字などをサポートします。
  • gbk は簡体字中国語文字をサポートしています。

big5 は繁体字中国語文字をサポートしています。
  • utf8 は、ほぼすべての国の文字をサポートしています。

以上がmysql5.5で文字エンコーディングをクエリするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。