ホームページ >バックエンド開発 >PHPチュートリアル >Wireshark パケット キャプチャ分析 PHP 中国語文字化けソリューション概要分析
1つ。 1 つ目は、PHP Web ページのエンコーディングです
1。php ファイル自体のエンコーディングと Web ページのエンコーディングは
a と一致する必要があります。gb2312 エンコーディングを使用する場合、php は header(" Content-Type: text/html; charset=gb2312″ )、静的ページに を追加します。メモ帳で開き、エンコーディングを ANSI として選択してファイルを上書きします。
b. utf-8 エンコーディングを使用する場合は、php が header("Content-Type: text/html; charset=utf-8'') を追加し、すべてのファイルのエンコード形式である -Type" c/html> を追加します。 utf-8です。 utf-8 として保存するのは少し面倒かもしれません。セッションを使用する場合は、editplus を使用して保存できます。パラメータの選択 -> ファイル -> UTF-8 署名で、「常に削除」を選択し、BOM 情報を削除します。
2. PHP 自体は Unicode ではないため、substr などのすべての関数を mb_substr に変更する必要があります (mbstring 拡張機能をインストールする必要があります)。または、iconv を使用してトランスコードできます。
2つ。 PHP と Mysql の間のデータ対話
PHP とデータベースのエンコーディングは一貫している必要があります
1. mysql 設定ファイル my.ini または my.cnf を変更します。mysql[mysql]
default-character には utf8 エンコーディングを使用するのが最適です。 -set=utf8
[mysqld ]
default-character-set=utf8
default-storage-engine=MyISAM
[mysqld] の下に追加します:
default-collation=utf8_bin
init_c NAMES utf8′
2. PHP の前に mysql_query を追加します。データベース操作を実行する必要があるプログラム (「set names 'encoding'」)。PHP エンコーディングが gb2312 の場合、mysql エンコーディングは gb2312 です。 mysqlのエンコードはutf8なので、データの挿入時や取得時に文字化けが起こらない
3つ。 PHPはオペレーティングシステムに関係しています
WindowsとLinuxのエンコーディングが異なります。 Windows環境では、PHP関数を呼び出すときにパラメータがutf-8でエンコードされている場合、move_uploaded_file()、filesize()、readfileなどのエラーが発生します。 () など、これらの関数はアップロードとダウンロードの処理時によく使用されます。呼び出し時に次のエラーが発生する場合があります:
警告: move_uploaded_file()[function.move-uploaded-file]: ストリームを開けませんでした: 無効な引数です。
警告: move_uploaded_file()[function.move-uploaded-file]:… の ” を ” に移動できません
警告: filesize() [function.filesize]: … の ... で統計に失敗しました
警告: readfile() [関数.readfile ]: failed to open stream: Invalid argument in ..
Linux 環境で gb2312 エンコードを使用する場合、これらのエラーは発生しませんが、この場合、保存されたファイル名が文字化けし、ファイルを読み取ることができません。システムによって認識されるエンコーディングは、エンコーディング変換に使用できます: mb_convert_encoding (文字列、新しいエンコーディング、元のエンコーディング) または iconv (元のエンコーディング、新しいエンコーディング、文字列) この方法で保存されたファイル名。処理後は文字化けせず正常に読み込むことができ、中国語名のファイルのアップロードとダウンロードを実現します。
実際には、システムから完全に分離する、より良い解決策があります。そのため、システムのエンコーディングを考慮する必要はありません。ファイル名として文字と数字のみのシーケンスを生成し、データベースに漢字を含む元の名前を保存することができます。この方法では、ダウンロード時に move_uploaded_file() を呼び出すときに問題は発生しません。ファイル名を中国語の文字を含む元の名前に変更します。ダウンロードを実装するコードは次のとおりです。
header(”Pragma: public”);
header(”Expires: 0″); 0'') ;
header("コンテンツの種類: $file_size");
header("コンテンツの配置: 添付ファイル名"); header(" Content-Transfer-Encoding: binary");
readfile($file_path);
$file_type はファイルの種類、$file_name は元の名前、$file_path はサービス上に保存されたファイルのアドレスです。
4つ。文字化けが発生する理由をまとめてみましょう。文字化けが発生する原因は大きく分けて 2 つあります。1 つは、間違ったエンコード (文字セット) の設定により、ブラウザが間違ったエンコードで解析し、文字化けが発生することです。 2 つ目は、ファイルが間違ったエンコードで開かれて保存された場合です。たとえば、テキスト ファイルは元々 GB2312 でエンコードされていましたが、UTF-8 エンコードで開かれて保存されました。上記の文字化けコードの問題を解決するには、まず開発のどの側面にエンコーディングが関係しているかを知る必要があります:
1. ファイル エンコーディング: ページ ファイル (.html、.php など) 自体が保存されるエンコーディングを指します。 Notepad と Dreamweaver では、ページを開くときにファイルのエンコーディングが自動的に認識されるため、問題は少なくなります。ただし、ZendStudio はエンコーディングを自動的に認識しません。作業中に誤って間違ったエンコーディングでファイルを開き、変更を行った後にファイルを保存すると、文字化けしてしまいます。の文字が出てきます(しみじみ)。
2. ページ宣言のエンコーディング: HTML コード HEAD で、Web ページが使用するエンコーディングをブラウザーに伝えることができます。現在、中国の Web サイト開発では、XXX は主に GB2312 と UTF-8 エンコーディングを使用しています。
3. データベース接続エンコーディング: データベース操作を実行するときにデータベースにデータを送信するために使用されるエンコーディングを指します。たとえば、データベース自体のエンコーディングと混同しないように注意してください。 MySQL のエンコーディングは latin1 エンコーディングです。つまり、MySQL はデータの保存に latin1 エンコーディングに基づいており、他のエンコーディングで Mysql に送信されたデータは latin1 エンコーディングに変換されます。
WEB 開発でエンコーディングがどこに関係するかがわかったので、文字化けの原因もわかりました。上記の 3 つのエンコーディング設定は一貫性がありません。さまざまなエンコーディングのほとんどは ASCII と互換性があるため、英語の記号は表示されず、中国語の文字は表示されません。不運になるでしょう。
5つ目。いくつかの一般的なエラー状況と解決策に対処してみましょう:
1. データベースは UTF8 エンコーディングを使用しており、ページ宣言エンコーディングは GB2312 です。これは文字化けの最も一般的な原因です。このとき、PHP スクリプト内の直接 SELECT データは文字化けします。クエリを実行する前に mysql_query("SET NAMES GBK"); を使用して、MYSQL 接続エンコーディングを設定し、ページ宣言エンコーディングが接続と一致していることを確認する必要があります。ここでエンコードを設定します (GBK は GB2312 の拡張子です)。ページが UTF-8 でエンコードされている場合は、 mysql_query("SET NAMES UTF8"); を使用できます。
これは、一般的に使用される UTF-8 ではなく UTF8 であることに注意してください。ページ宣言のエンコーディングがデータベースの内部エンコーディングと一致している場合は、接続エンコーディングを設定する必要はありません。
注: 実際、MYSQL のデータ入出力は、上記で説明したものよりも複雑です。MYSQL 設定ファイル my.ini には 2 つのデフォルトのエンコーディングが定義されています。これらは、[client] と [ のデフォルトの -character-set です。 mysqld]。default-character-set は、クライアント接続とデータベース内部にデフォルトで使用されるエンコーディングを設定します。上記で指定したエンコーディングは、実際には、MYSQL クライアントがサーバーに接続するときのコマンド ライン パラメーターcharacter_set_client であり、デフォルトのエンコーディングを使用する代わりに、受信したクライアント データのエンコーディングを MYSQL サーバーに伝えます。
2. ページ宣言のエンコーディングがファイル自体のエンコーディングと一致しない場合、エンコーディングが一致しない場合、ページ作成時にアーティストがブラウザに表示する内容が文字化けしてしまうため、これはめったに起こりません。多くの場合、リリース後にいくつかの軽微なバグを修正し、間違ったエンコーディングでページを開いて保存することが原因で発生します。または、CuteFTP などの一部の FTP ソフトウェアを使用してオンラインでファイルを直接変更すると、ソフトウェアのエンコード設定が間違っているため、間違ったエンコードが変換されます。
3. バーチャルホストをレンタルしている一部の友人は、上記の 3 つのエンコードが正しく設定されているにもかかわらず、依然としてコードが文字化けしています。たとえば、Web ページが GB2312 でエンコードされている場合、ブラウザのエンコードを手動で GB2312 に変更すると、Web ページの HEAD はすでに GB2312 として認識されます。 、ページは正常に表示されます。その理由は、サーバー Apache がサーバーのグローバルなデフォルト エンコーディングを設定し、httpd.conf に AddDefaultCharset UTF-8 を追加するためです。このとき、サーバーは最初に HTTP ヘッダーをブラウザーに送信しますが、その優先順位はページ内で宣言されたエンコーディングよりも高くなります。当然、ブラウザーはそれを誤って認識します。解決策は 2 つあります。管理者は、AddDefaultCharset GB2312 を独自の仮想マシンの構成ファイルに追加してグローバル構成をオーバーライドするか、独自のディレクトリの .htaccess で構成する必要があります。
要約: つまり、PHP で中国語の文字化けコードを解決する最善かつ最速の方法は、ページによって要求されたページ番号がデータベースの内部エンコーディングと一致しない場合、ページによって宣言されたエンコーディングを作成することです。データベースの内部エンコーディング、接続エンコーディングを設定する、mysql_query ("SET NAMES XXX"); XXX は、文字化けの問題を確実に解決します。
以上、Wireshark パケット キャプチャ解析の概要と PHP 中国語文字化け解決方法を紹介しました。PHP チュートリアルに興味のある友人の参考になれば幸いです。