php の中国語以外の文字を削除するメソッド: 正規表現で preg_replace() 関数を使用して、文字列内の中国語以外の文字を検索し、空の文字に置き換えます。構文は "preg_replace("/ [ ^\x{4E00}-\x{9FFF}] /u",'', $str)"。
このチュートリアルの動作環境: Windows7 システム、PHP7.1 バージョン、DELL G3 コンピューター
php では、次のことができます。 use preg_replace () 関数は正規表現と連携して、文字列内の中国語以外の文字を削除します。
正規表現は次のとおりです:
/[^\x{4E00}-\x{9FFF}] /u
preg_replace () 削除の原則: 正規表現を使用して文字列内の中国語以外の文字を検索し、空の文字 ''
に置き換えます。
実装例:
<?php header('content-type:text/html;charset=utf-8'); $str= 'php中文网!-=1548'; $pattern = "/[^\x{4E00}-\x{9FFF}]+/u"; echo preg_replace($pattern,'', $str); ?>
説明: preg_replace():
preg_replace() 関数は通常の処理を実行できます。式 式の検索と置換は強力な文字列置換処理関数です。この関数の構文形式は次のとおりです:
preg_replace($pattern, $replacement, $subject [, $limit = -1 [, &$count]])
パラメータの説明は次のとおりです:
$subject が配列の場合、preg_replace() 関数は配列を返し、それ以外の場合は文字列を返します。
関数 preg_replace() が一致を見つけた場合は、置換された $subject を返します。そうでない場合は、変更されていない $subject を返します。 preg_replace() 関数の各パラメータ (パラメータ $limit を除く) は配列にすることができます。 $pattern パラメーターと $replacement パラメーターが両方とも配列の場合、関数は配列内に出現する順序でキーを処理します。エラーが発生した場合は NULL が返されます。
パラメータ $replacement には後方参照 \\n または $n を含めることができますが、構文的には後者の方が優先されます。このような各参照は、一致した n 番目のキャプチャ サブグループによってキャプチャされたテキストに置き換えられます。 n は 0 ~ 99 で、\\0 と $0 は完全なパターン マッチング テキストを表します。
キャプチャ サブグループのシリアル番号のカウント方法は次のとおりです。キャプチャ サブグループを表す左括弧は、1 から開始して左から右に数えられます。 $replacement でバックスラッシュを使用する場合は、4 ("\\\\" を使用する必要があります。これは、最初は PHP 文字列であり、エスケープ後は 2 になり、正規表現を通過した後は文字列とみなされます。エンジン。オリジナルのバックスラッシュ)。
置換モードで作業しており、後方参照の後に別の数値を続ける必要がある場合 (例: 一致するパターンの直後に元の数値を追加する)、構文 \\1 は使用できません。後方参照について説明します。たとえば、 \\11 を指定すると、 preg_replace() は \\1 後方参照の後に元の 1 が続くのか、それとも \\11 後方参照の後に何も続くのかを理解できなくなります。この場合の解決策は、${1}1 を使用することです。これにより、$1 の別の後方参照、つまりソース 1 の別の後方参照が作成されます。
非推奨の e 修飾子を使用する場合、この関数は一部の文字 ('、"、\、および NULL) をエスケープし、後方参照置換を実行します。これが完了するときは、参照が解析された後に必ず後方参照してください。 、一重引用符や二重引用符によって引き起こされる構文エラーはありません (例: 'strlen(\'$1\') strlen("$2")')。PHP の文字列構文に準拠し、eval 構文に準拠していることを確認してください。置換が完了すると、エンジンは eval メソッドを使用して結果の文字列を PHP コードとして評価し、戻り値を置換に参加する最終文字列として使用します。
推奨される学習: "PHP ビデオチュートリアル "
以上がPHPで中国語以外の文字を削除する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。