文字化け

WBOY
WBOYオリジナル
2016-06-23 14:10:15911ブラウズ

<?php$url = 'http://luolai.tmall.com/search.htm?pageNum=1';  $lines_array = file($url);  echo $lines_array; echo "<br/>"; $lines_string = implode('', $lines_array);   eregi("<title>(.*)</title>", $lines_string, $head); echo "head:".$head;  echo "<br/>"; print_r($head); echo "<br/>";  echo "title:".$head[1]; ?>

この印刷物は文字化けしていますが、文字化けを防ぐにはどうすればよいですか?


返信ディスカッション (解決策)

これを試してください: & lt ;? PHP

Function File_get_Contents_utf8 ($ Fn) {
$ content = file_get_contents ($ fn); ($content, 'UTF-8, ISO-8859-1', true));
}
?>


タオバオは gb2312 エンコードなので、文字化けします。
echo "title:".iconv('gbk','utf-8',$head[1]);

彼のページは gb2312 で、あなたのページは utf-8 です
したがって、印刷する前にこれを行う必要があります エンコーディング変換

$head = iconv('gbk', 'utf-8', $head);


上記の 3 人の誰も文字列を取り出すことができず、空白として表示されます

iconv 関数または mb_convert_encoding 関数を使用して、 Web ページ全体の file_get_contents では文字化けは表示されませんが、正規表現を使用すると途中の中国語文字列を抽出できません。

Deprecated がありますが: Function eregi() is deprecated in Array error warning

but the result is just there

Array

(
[0] => b2386ffb911b14667cb8f0f91ea547a7 ベビーリストページ - Luolai Home Textiles 公式旗艦店 - -days Cat Tmall.com
)
076402276aae5dbec7f672f8f4e5cc81title:
ホームテキスタイル公式旗艦店 - Tmall.com

さて、この問題は正規表現と一致させるために ~ を使用すると解決しました。 / を使用すると、エラーは報告されませんでした。ご助力に改めて感謝いたします。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。