PHP 修剪 unicode 空格

Question

我正在嘗試修剪諸如此字元之類的unicode空格，並且我能夠使用此解決方案來做到這一點。此解決方案的問題是它不會修剪普通字元之間的unicode空格。例如這個使用薄空間$string="   test   string   ";echopreg_replace('/^[\pZ\pC]+|[\pZ\pC]+$/u','',$string)；// str

P粉557957970 · Answer

要刪除字串開頭和結尾處的所有帶有控製字元的 Unicode 空白，以及刪除字串內任何位置除常規空格之外的所有帶有控製字元的 Unicode 空白，您可以使用

preg_replace('/^[\pZ\pC]+|[\pZ\pC]+$|(?! )[\pZ\pC]/u', '', $string)
// Or, simply
preg_replace('/^\s+|\s+$|[^\S ]/u', '', $string)

請參閱正規表示式示範 #1 和正規表示式示範 #2。

詳細資訊

^[\pZ\pC] - 字串開頭的一個或多個空格或控製字元
| - 或
[\pZ\pC] $ - 字串末端的一個或多個空格或控製字元
| - 或
(?! )[\pZ\pC] - 字串內任意位置除常規空格之外的一個或多個空格或控製字元
[^\S ] - 常規空格 (\x20) 以外的任何空格

如果您還需要「排除」常見換行符，請將(?! )[\pZ\pC] 替換為(?![ ])[ \pZ \pC] （由 @MonkeyZeus 建議），在第二個正規表示式中，這表示您需要使用[^\S ]。

查看 PHP 示範：

echo preg_replace('~^[\pZ\pC]+|[\pZ\pC]+$|(?! )[\pZ\pC]~u', '', 'abc def ghi      ');
// => abc defghi
echo preg_replace('/^\s+|\s+$|[^\S ]/u', '', 'abc def ghi     ');
// => abc defghi

P粉445750942 · Answer

這樣的 Unicode 空格 \u{2009} 如何在不同的地方造成問題。因此，我會將所有 unicode 空格替換為常規空格，然後套用 trim()。

$string = "   test   string and XY 	 ";
//\u{2009}\u{2009}\u{2009}test\u{2009}\u{2009}\u{2009}string\u{2009}and\x20XY\x20\x09\u{2009}

$trimString = trim(preg_replace('/[\pZ\pC]/u', ' ', $string));
//test\x20\x20\x20string\x20and\x20XY

注意：註解中字串的表示是用 debug::writeUni($string, $trimString); 來表示的。從此類實作。

PHP 修剪 unicode 空格

全部回覆(2)我來回復