ホームページ >バックエンド開発 >PHPチュートリアル >PHP で生成された HTML から複数の UTF-8 BOM シーケンスを削除するにはどうすればよいですか?
複数の UTF-8 BOM シーケンスの削除
PHP5 (CGI) を使用して HTML テンプレートを生成する場合、生の HTML 出力で問題が発生する可能性があります。複数の UTF-8 バイト オーダー マーク (BOM) の存在。これを解決するには、次の戦略の実装を検討してください。
正規表現の使用
1 つの方法は、正規表現を使用して BOM を削除することです。以下のコードを利用すると、テキストから BOM のすべてのインスタンスを効果的に削除できます。
function remove_utf8_bom($text) { $bom = pack('H*','EFBBBF'); $text = preg_replace("/^$bom/", '', $text); return $text; }
カスタム バイト削除
または、BOM を手動で削除することもできます。入力テキストの最初の 3 バイトを検査し、UTF-8 BOM シーケンスと一致する場合はそれらを削除します。次のコード スニペットは、このアプローチを示しています。
if (substr($t, 0, 3) == b'\xef\xbb\xbf') { $t = substr($t, 3); }
これらの手法のいずれかを実装すると、余分な UTF-8 BOM を正常に削除し、Firefox で HTML テンプレートが適切に表示されるようになります。
以上がPHP で生成された HTML から複数の UTF-8 BOM シーケンスを削除するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。