ホームページ >バックエンド開発 >PHPチュートリアル >PHP_PHP チュートリアルの中国語文字化けの一般的な解決策のまとめ

PHP_PHP チュートリアルの中国語文字化けの一般的な解決策のまとめ

WBOY
WBOYオリジナル
2016-07-15 13:26:38712ブラウズ

PHP 中国語の文字化けは、PHP 開発でよくある問題の 1 つです。 PHP の中国語の文字化けは、Web ページ自体で発生することもあれば、MySQL の対話プロセスで発生することもあり、オペレーティング システムに関連していることもあります。ここに概要を示します。

1つ。 1 つ目は、PHP Web ページのエンコーディングです

1。php ファイル自体のエンコーディングと Web ページのエンコーディングは

a と一致する必要があります。gb2312 エンコーディングを使用する場合、php はヘッダーを出力する必要があります。 header(“Content-Type: text/html; charset =gb2312”)、静的ページに を追加します。すべてのファイルの形式は ANSI であり、メモ帳で開いて、ソース ファイルを上書きして ANSI にエンコードして保存できます。

b. utf-8 エンコーディングを使用する場合、php はヘッダーを出力する必要があります: header("Content-Type: text/html; charset=utf-8")、 の場合、すべてのファイルのエンコード形式は utf-8 です。 utf-8 として保存するのは少し面倒かもしれません。セッションを使用する場合は、editplus を使用して保存できます。パラメータの選択 -> ファイル -> UTF-8 署名で、[常に削除] を選択し、BOM 情報を削除します。

2. PHP 自体は Unicode ではないため、substr などのすべての関数を mb_substr に変更する必要があります (mbstring 拡張機能をインストールする必要があります)。または、iconv を使用してトランスコードできます。

Ⅱ。 PHP と Mysql 間のデータ対話 PHP とデータベースのエンコーディングは一貫している必要があります

1. mysql 設定ファイル my.ini または my.cnf を変更します。mysql には utf8 エンコーディングを使用するのが最適です

default-character-set= utf8

[mysqld]
default-character-set=utf8
default-storage-engine=MyISAM
[mysqld] の下に追加します:
default-collat​​ion=utf8_bin
init_connect='SET NAMES utf8'

2. 行う必要があること データベース操作用の PHP プログラムの前に mysql_query("set names 'encoding'"); を追加します。PHP エンコーディングが gb2312 の場合、mysql エンコーディングは gb2312 です。 . utf-8 であれば、mysql エンコーディングは utf8 になります。 このようにすると、データを取得するときに文字化けが発生しません

3. PHPはオペレーティングシステムと関係があります

WindowsとLinuxのエンコーディングが異なります。 Windows環境でPHP関数を呼び出す際、パラメータがutf-8エンコーディングの場合、move_uploaded_file()、filesize(などのエラーが発生します。 )、readfile( ) など。これらの関数は、アップロードとダウンロードの処理時によく使用されます。呼び出し時に次のエラーが発生する可能性があります:

警告: move_uploaded_file()[function.move-uploaded-file]: ストリームを開けませんでした: 無効です。 ...

の引数 警告: move_uploaded_file()[function.move-uploaded-file]:...

の '' を '' に移動できません 警告: filesize() [function.filesize]: stat が失敗しました.. . in ...

警告: readfile() [function.readfile]: ストリームを開けませんでした: ..

の引数が無効です。これらのエラーは、Linux 環境で gb2312 エンコーディングを使用する場合には発生しませんが、ファイル名保存後 文字化けによりファイルが読み込めない場合は、まずパラメータをオペレーティングシステムが認識するエンコードに変換することができます。エンコード変換には、mb_convert_encoding (文字列、新しいエンコード、元のエンコード) または iconv (元のエンコード) を使用できます。 、新しいエンコーディング、文字列)なので、処理後に保存されたファイル名は文字化けせず、正常に読み込むことができ、中国語名のファイルのアップロードとダウンロードが可能になります。

実際には、より良い解決策があります。それは、システムから完全に分離することです。そのため、システムのエンコーディングを考慮する必要はありません。ファイル名として文字と数字のみのシーケンスを生成し、データベースに漢字を含む元の名前を保存することができます。この方法では、ダウンロード時に move_uploaded_file() を呼び出すときに問題は発生しません。ファイル名を中国語の文字を含む元の名前に変更します。ダウンロードを実装するコードは以下の通りです

header("Pragma: public");

header("Expires: 0");

header("Cache-Component: must-revalidate, post-check=0, pre -check= 0");

header("Content-type: $file_type");

header("Content-Length: $file_size");

header("Content-Disposition:attachment; filename="$ file_name"" );

header("Content-Transfer-Encoding: binary");

readfile($file_path);

$file_type はファイルの種類、$file_name は元の名前、$file_path はファイルですサービスアドレスに保存されます。

4つ。文字化けが発生する理由をまとめてみましょう

文字化けが発生する原因は、一般的に 2 つあります。 1 つ目は、エンコード (文字セット) の設定が間違っているため、ブラウザが間違ったエンコードで解析し、画面が乱雑な「天国の本」でいっぱいになった後、ファイルが間違ったエンコードで開かれ、その後保存されました。たとえば、テキスト ファイルは元々 GB2312 でエンコードされていましたが、UTF-8 エンコードで開かれて保存されました。上記の文字化けコードの問題を解決するには、まず開発のどの側面にエンコーディングが関係しているかを知る必要があります:

1. ファイル エンコーディング: ページ ファイル (.html、.php など) 自体が保存されるエンコーディングを指します。 Notepad と Dreamweaver では、ページを開くときにファイルのエンコーディングが自動的に認識されるため、問題は少なくなります。ただし、ZendStudio はエンコーディングを自動的に認識しません。作業中に誤って間違ったエンコーディングでファイルを開き、変更を行った後にファイルを保存すると、文字化けしてしまいます。の文字が出てきます(しみじみ)。

2. ページ宣言のエンコーディング: HTML コード HEAD で、 を使用して、Web が何であるかをブラウザーに伝えることができます。ページはエンコーディングを使用します。現在、XXX は中国の Web サイト開発で主に GB2312 と UTF-8 を使用します。

3. データベース接続エンコーディング: データベース操作を実行する際にどのエンコーディングが使用されるかを指します。たとえば、MySQL の内部デフォルト エンコーディングは latin1 エンコーディングです。これは、MySQL が他のエンコーディングで Mysql に送信されたデータは latin1 エンコーディングに変換されることを意味します。 WEB 開発で使用されるエンコーディングについて理解します。文字化けの原因は次のとおりです。さまざまなエンコーディングのほとんどが ASCII 互換であるため、英語の記号は表示されず、中国語の文字は表示されません。運が悪いでしょう

5. よくあるエラーの状況と解決策: 1. データベースは UTF8 エンコーディングを使用しており、ページ宣言のエンコーディングは現時点では文字化けの最も一般的な原因です。 PHP スクリプトで直接 SELECT されたデータは文字化けします。クエリを実行する前に mysql_query("SET NAMES GBK"); を使用して MYSQL 接続エンコーディングを設定し、ページ宣言エンコーディングが接続エンコーディング セットと一致していることを確認する必要があります。ページが UTF-8 でエンコードされている場合は、ここで (GBK は GB2312 の拡張子です)、mysql_query("SET NAMES UTF8"); を使用できます。一般的に使用される UTF-8 ではなく、UTF8 であることに注意してください。ページによって宣言されたエンコーディングはデータベースの内部エンコーディングと一致するため、接続エンコーディングを設定する必要はありません

注: 実際には、MYSQL のデータ入力と出力は上記よりも複雑です。 MYSQL 設定ファイル my.ini で定義されたデフォルトのエンコーディング ([client] の default-character-set および [mysqld] の default-character-set ) クライアント接続とデータベースで内部的にデフォルトで使用されるエンコーディングを設定します。上記で指定したエンコーディングは、実際には、MYSQL クライアントがサーバーに接続するときに、デフォルトのエンコーディング

2 を使用するのではなく、受信したクライアント データのエンコーディングを MYSQL サーバーに伝えるためのコマンド ライン パラメーターです。ファイル自体のエンコーディングと一致しない場合、ページを作成したときに表示されるコードが文字化けするため、これはめったに起こりません。これは、ファイルを開いたときに発生するいくつかの小さなバグを将来修正する予定です。ページを間違ったエンコードで保存してしまいました。または、CuteFTP などの一部の FTP ソフトウェアを使用してオンラインでファイルを直接変更すると、ソフトウェアのエンコード設定が間違っているため、間違ったエンコードが変換されます。

3. バーチャルホストをレンタルした一部の友人は、上記の 3 つのエンコードが正しく設定されているにもかかわらず、依然として文字化けが発生していることに気づきました。たとえば、Web ページが GB2312 でエンコードされている場合、ブラウザのエンコードを手動で GB2312 に変更すると、Web ページの HEAD はすでに GB2312 として認識されます。 、ページは正常に表示されます。その理由は、サーバー Apache がサーバーのグローバルなデフォルト エンコーディングを設定し、httpd.conf に AddDefaultCharset UTF-8 を追加するためです。このとき、サーバーは最初に HTTP ヘッダーをブラウザーに送信しますが、その優先順位はページ内で宣言されたエンコーディングよりも高くなります。当然、ブラウザーはそれを誤って認識します。解決策は 2 つあります。管理者は、AddDefaultCharset GB2312 を独自の仮想マシンの構成ファイルに追加してグローバル構成をオーバーライドするか、独自のディレクトリの .htaccess で構成する必要があります。

要約: 一言で言えば、PHP の中国語の文字化けコードを解決する最善かつ最速の方法は、ページに適用されているページ番号がデータベースの内部エンコーディングと一致しない場合、ページによって宣言されたエンコーディングを一致させることです。データベースの内部エンコーディング、接続エンコーディングを設定します。 mysql_query("SET NAMES XXX ");

http://www.bkjia.com/PHPjc/446598.html

www.bkjia.com
  1. tru​​e
http://www.bkjia.com/PHPjc/446598.html
技術記事

PHP 中国語の文字化けは、PHP 開発においてよくある問題の 1 つです。 PHP の中国語の文字化けは、Web ページ自体で発生することもあれば、MySQL の対話プロセスで発生することもあり、オペレーティング システムに関連していることもあります。以下に入力してください...
声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。