P粉1988143722023-08-25 00:30:22
###やり方がある。すべての
uXXXX を HTML 表現に置き換え、
html_entity_decode() を実行します。
echo html_entity_decode("Jalostotitlán");
形式
u1234 のすべての UTF 文字は、HTML では
ሴ として出力できます。ただし、UTF シーケンスの先頭を識別する文字が他にない場合、誤検知が大量に発生する可能性があるため、置換を行うことは非常に困難です。単純な正規表現は
のようになります。
preg_replace('/u([\da-fA-F]{4})/', '\1;', $str)