PHP 5のストリーム読み込み関数のデフォルトのエンコードはUTF-8のようですが、以前はPHP 4では直接file_get_contents()でgb2312エンコードを正常に読み込んでいましたが、5になると文字化けしてしまいます。オンラインの解決策には、クロール後に iconv() を使用してトランスコードするように記載されています。それを読んだ後、私は何かが間違っていると感じました。1 つは、iconv ライブラリがコンパイルされていない可能性があることです。そして、より大きな問題は、エンコーディングがストリーム変換に関連していることです (iconv が使用されている場合、PHP は実際にコードを 2 回変換します: stream -> UTF-8 -> GB2312): この忙しい作業は無駄ではありませんか?
私は PHP のドキュメントを注意深く読みました (みんながどのようにコードを書いているかはわかりませんが、ドキュメントは非常に明確です)。fopen() と file_get_contents() については、「デフォルトは UTF-8 ですが、ユーザーは」と述べています。 Unicode セマンティクスが有効な場合、読み取られたデータのデフォルトのエンコーディングは UTF-8 です。カスタム コンテキストを作成するか、stream_default_encoding () を使用してデフォルトを変更することで、別のエンコーディングを指定できます。そこで、 stream_default_encoding('gb2312'); を使用してテストしました。 しかし、この関数は存在しませんか? ! php6のみ対応しているようです。ただし、確実なパスはなく、使用できる「ユーザー定義のコンテキスト属性」もあります。
ドキュメントをより注意深く読んだ後、私は最終的にこの問題を解決しました:
//ストリームのエンコード形式を設定します。これがネットワークアクセスの場合、ファイルを http
$opts = に変更します。 array('file ' => array('encoding' => 'gb2312'));
$ctxt = stream_context_create($opts);
file_get_contents(ファイル名, FILE_TEXT, $ctxt);