ホームページ  >  記事  >  バックエンド開発  >  PHP中国語文字化けの解決策

PHP中国語文字化けの解決策

巴扎黑
巴扎黑オリジナル
2016-11-21 13:58:23981ブラウズ

1. 1 つ目は、PHP Web ページのエンコーディングです

1。PHP ファイル自体のエンコーディングと Web ページのエンコーディングは一致する必要があります

a。gb2312 エンコーディングを使用する場合、PHP はヘッダーを出力する必要があります: header(" Content-Type: text/html;charset= gb2312")、静的ページに を追加します。すべてのエンコード形式ファイルは ANSI であり、メモ帳で開き、選択したエンコーディングとしてソース ファイルを上書きします。

b. utf-8 エンコーディングを使用する場合、php はヘッダーを出力する必要があります: header("Content-Type: text/html;charset=utf-8")、、すべてのファイルのエンコード形式は utf-8 です。 utf-8 として保存するのは少し面倒かもしれません。セッションを使用する場合は、editplus を使用して保存できます。パラメータの選択 -> ファイル -> UTF-8 署名で、「常に削除」を選択し、BOM 情報を削除します。

2. PHP 自体は Unicode ではないため、substr などのすべての関数を mb_substr に変更する必要があります (mbstring 拡張機能をインストールする必要があります)。または、iconv を使用してトランスコードできます。

2. PHP と Mysql の間のデータ対話

PHP とデータベースのエンコーディングは一貫している必要があります

1. mysql 設定ファイル my.ini または my.cnf を変更します。mysql には utf8 エンコーディングを使用するのが最善です

。 default-character-set=utf8
[mysqld]
default-character-set=utf8
default-storage-engine=MyISAM
[mysqld] の下に追加します:
default-collat​​ion=utf8_bin
init_connect='SET NAMES utf8'

2. データベースを作成する必要がある場合、動作中の PHP プログラムの前に mysql_query("set names'coding'"); を追加します。PHP エンコーディングが gb2312 の場合、mysql エンコーディングは gb2312 です。 utf-8の場合、mysqlのエンコーディングはutf8になります。 この方法で挿入または取得してもデータの文字化けはありません

3. PHPはOSと関係があります

WindowsとLinuxではエンコーディングが異なります。 Windows環境でPHP関数を呼び出す際、パラメータがUTF-8エンコーディングの場合、move_uploaded_file()、filesize()などのエラーが発生します。 、readfile() など。これらの関数は、アップロードとダウンロードの処理時によく使用されます。呼び出し時に次のエラーが発生する場合があります:

警告: move_uploaded_file()[function.move-uploaded-file]: ストリームを開けませんでした: 無効な引数です。 ..

警告: move_uploaded_file()[function.move-uploaded-file]:...で '' を '' に移動できません

警告: filesize() [function.filesize]: .. の統計に失敗しました. in ...

警告: readfile() [function.readfile]: ストリームを開けませんでした: ..

の引数が無効です。これらのエラーは、Linux 環境で gb2312 エンコーディングを使用する場合には発生しませんが、保存後のファイル名はこの場合、文字化けしてファイルを読み込むことができなくなります。この場合、まずオペレーティング システムが認識するエンコードに変換することができます。mb_convert_encoding (文字列、新しいエンコード、元のエンコード) を使用できます。または iconv (元のエンコード、新しいエンコード、文字列) の対処方法です。後から保存したファイル名は文字化けせず、正常に読み込むことができ、中国語名のファイルもアップロード、ダウンロードできます。

実際には、より良い解決策があります。それは、システムから完全に分離することです。そのため、システムのエンコーディングを考慮する必要はありません。ファイル名として文字と数字のみのシーケンスを生成し、データベースに漢字を含む元の名前を保存することができます。この方法では、ダウンロード時に move_uploaded_file() を呼び出すときに問題は発生しません。ファイル名を中国語の文字を含む元の名前に変更します。ダウンロードを実装するコードは以下の通りです

header("Pragma: public");

header("Expires: 0");

header("Cache-Component: must-revalidate, post-check=0, pre -check= 0");

header("Content-type: $file_type");

header("Content-Length: $file_size");

header("Content-Disposition:attachment; filename="$ file_name"" );

header("Content-Transfer-Encoding: binary");

readfile($file_path);

$file_type はファイルのタイプ、$file_name は元の名前、$file_path はファイルですサービスアドレスに保存されます。

4つ。 文字化けが発生する理由をまとめてみましょう。文字化けが発生する原因は大きく分けて 2 つあります。1 つは、間違ったエンコード (文字セット) の設定により、ブラウザが間違ったエンコードで解析し、文字化けが発生することです。画面いっぱいに表示される「天の書」が表示され、その後、ファイルが間違ったエンコードで開かれ、保存されます。たとえば、テキスト ファイルは元々 GB2312 でエンコードされていましたが、UTF-8 エンコードで開かれて保存されました。上記の文字化けコードの問題を解決するには、まず開発のどの側面にエンコーディングが関係しているかを知る必要があります:

1. ファイル エンコーディング: ページ ファイル (.html、.php など) 自体が保存されるエンコーディングを指します。 Notepad と Dreamweaver では、ページを開くときにファイルのエンコーディングが自動的に認識されるため、問題は少なくなります。ただし、ZendStudio はエンコーディングを自動的に認識しません。作業中に誤って間違ったエンコーディングでファイルを開き、変更を行った後にファイルを保存すると、文字化けしてしまいます。の文字が出てきます(しみじみ)。

2. ページ宣言のエンコーディング: HTML コード HEAD で、 を使用して、Web が何であるかをブラウザーに伝えることができます。ページはエンコーディングを使用します。現在、XXX は中国の Web サイト開発で主に GB2312 と UTF-8 を使用します。

3. データベース接続エンコーディング: データベース操作を実行するときにどのエンコーディングが使用されるかを指します。たとえば、MySQL の内部デフォルト エンコーディングは latin1 エンコーディングです。これは、Mysql が他のエンコーディングで Mysql に送信されたデータは latin1 エンコーディングで保存されることを意味します。
エンコーディングに関しては、文字化けの原因がわかります。さまざまなエンコーディングのほとんどが ASCII 互換であるため、英語の記号は表示されません。

5 つの一般的なエラー状況と解決策:

1. データベースは UTF8 エンコーディングを使用しており、これが文字化けの最も一般的な原因です。今回は、PHP スクリプト内の直接 SELECT データが文字化けするため、クエリを実行する前に、mysql_query("SET NAMES GBK"); を使用して MYSQL 接続エンコーディングを設定し、ページ宣言エンコーディングが正しいことを確認する必要があります。ここで設定した接続エンコーディングと一致します (GBK は GB2312 の拡張です)。mysql_query("SET NAMES UTF8"); を使用できます。一般的に使用される UTF ではなく UTF8 であることに注意してください。 -8. ページで宣言されたエンコーディングがデータベースの内部エンコーディングと一致している場合、接続エンコーディングを設定する必要はありません。実際には、MYSQL のデータ入力と出力は上記よりも複雑です。 MYSQL 設定ファイル my.ini には 2 つのデフォルトのエンコーディングが定義されています。それらは、[client] のデフォルト文字セットと [mysqld] のデフォルト文字セットです。クライアント接続とデータベースで使用されるエンコーディングを設定します。デフォルトでは、上で指定したエンコーディングは、実際には MYSQL クライアントがサーバーに接続するときのコマンド ライン パラメータであるcharacter_set_client であり、デフォルトのエンコーディングは使用されません。ページ宣言のエンコーディングがファイル自体のエンコーディングと一致しない場合、ページの作成時にブラウザに表示される内容が公開後に変更される可能性が高くなるため、これはめったに起こりません。間違ったエンコードでページを開いて保存したり、CuteFTP などの FTP ソフトウェアをオンラインで直接変更したりすると、ソフトウェアのエンコード設定が間違っているために間違ったエンコードが変換されてしまいます。

3. バーチャルホストをレンタルした一部の友人は、上記の 3 つのエンコードが正しく設定されているにもかかわらず、依然として文字化けが発生していることに気づきました。たとえば、Web ページが GB2312 でエンコードされている場合、ブラウザのエンコードを手動で GB2312 に変更すると、Web ページの HEAD はすでに GB2312 として認識されます。 、ページは正常に表示されます。その理由は、サーバー Apache がサーバーのグローバルなデフォルト エンコーディングを設定し、httpd.conf に AddDefaultCharset UTF-8 を追加するためです。このとき、サーバーは最初に HTTP ヘッダーをブラウザーに送信しますが、その優先順位はページ内で宣言されたエンコーディングよりも高くなります。当然、ブラウザーはそれを誤って認識します。解決策は 2 つあります。管理者は、AddDefaultCharset GB2312 を独自の仮想マシンの構成ファイルに追加してグローバル構成をオーバーライドするか、独自のディレクトリの .htaccess で構成する必要があります。

要約: 一言で言えば、PHP の中国語の文字化けコードを解決する最善かつ最速の方法は、ページに適用されているページ番号がデータベースの内部エンコーディングと一致しない場合、ページによって宣言されたエンコーディングを一致させることです。データベースの内部エンコーディング、接続エンコーディングを設定します。 mysql_query("SET NAMES XXX"); &b=你好

パラメータを渡すと内部エラーが発生します

解決策: "test.php ?a=".urlencode(你)好)."&b=".urlencode(你好)

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。