iconv 関数を使用して、キャプチャした utf-8 でエンコードされたページを gb2312 に変換すると、iconv 関数を使用してキャプチャしたデータをトランスコードすると、理由もなくデータが少なくなることがわかりました
コードは次のとおりです | コードをコピー |
echo $str= 'こんにちは、ここではコーヒーを販売しています!'; echo iconv('GB2312', 'UTF-8', $str); //文字列エンコーディングを GB2312 から UTF-8 に変換します echo iconv_substr($str, 1, 1, 'UTF-8'); //バイト数ではなく文字数で切り捨てる echo iconv_strlen($str, 'UTF-8') //設定されたエンコーディングの文字列長を取得します //これも使われています $content = iconv("UTF-8","gbk//TRANSLIT",$content); |
iconv(“UTF-8″,”GB2312//IGNORE”,$data)
Ignore は、変換中にエラーを無視することを意味します。ignore パラメータを指定しないと、この文字に続くすべての文字列を保存できません。
このiconv()関数はphp5に組み込まれています