ホームページ >バックエンド開発 >PHPチュートリアル >PHP正規表現の使い方_PHPチュートリアル
PHP 正規表現は主に、文字列のパターン分割、マッチング、検索、置換操作に使用されます。一部の単純な環境では正規表現の使用が効率的でない場合があるため、PHP 正規表現をより効果的に使用する方法を包括的に検討する必要があります。
私の PHP 正規表現入門は、インターネット上の記事から始まりました。この記事は、PHP 正規表現の使用法を浅いものから深いものまで説明していますが、それを使用する過程では、学習はまだ自分次第です。 , 私はまだ忘れてしまうので、この記事を4、5回読んで、より難しい知識のポイントについては、理解するのに長い時間がかかることもありますが、読み終わった後も読み続けてください。そうすれば、規則的なルールを適用する能力が大幅に向上することがわかります。
PHP 正規表現の定義:
文字の配置と一致パターンを記述する構文規則。これは主に、文字列のパターン分割、マッチング、検索、置換操作に使用されます。
PHP の通常の関数:
PHP には 2 つの通常関数のセットがあり、それらの関数は似ています:
1 つのセットは PCRE (Perl 互換正規表現) ライブラリによって提供されます。接頭辞「preg_」が付いた名前の関数
POSIX (Unix のポータブル オペレーティング システム インターフェイス) によって提供される拡張機能のセット。接頭辞「ereg_」が付いた名前の関数を使用してください (POSIX の通常の関数ライブラリは PHP 5.3 以降使用が推奨されなくなり、PHP 6 から削除されます)
POSIX 規則性が歴史の舞台に登場しようとしており、PCRE と perl の形式が似ているため、perl と php の間で切り替える方が便利であるため、ここでは PCRE 規則性の使用に焦点を当てます。
PCRE 正規表現
PCRE の正式名称は Perl Compatible Regular Expression で、Perl 互換の正規表現を意味します。
PCRE では、パターン式 (正規表現) は通常、「/apple/」のように 2 つのバックスラッシュ「/」で囲まれます。
正規表現におけるいくつかの重要な概念は、メタキャラクター、エスケープ、パターン単位 (繰り返し)、反意語、参照、およびアサーションです。これらの概念は、記事 [1] で簡単に理解して習得できます。
よく使用されるメタ文字:
メタキャラクターの説明
A は文字列の先頭のアトムと一致します
Z は文字列の末尾のアトムと一致します
b 単語 /bis/ の境界に一致します 先頭が /isb/ である文字列に一致します 末尾が /bisb/ である文字列に一致します 区切り
B 単語の境界を除く任意の文字に一致します /Bis/ 単語「This」の「is」に一致します
d [0-9] に相当する数値と一致します。
D [^0-9] に相当する数字を除く任意の文字に一致します。
w [0-9a-zA-Z_] に相当する英語の文字、数字、またはアンダースコアと一致します。
W は、[^0-9a-zA-Z_] に相当する英文字、数字、アンダースコアを除く任意の文字に一致します。
s は [ftv] に相当する空白文字と一致します。
S [^ftv] と同等の空白文字を除く任意の文字に一致します。
f x0c または cL と同等のフォーム フィードと一致します
x0a または cJ に相当する改行文字と一致します。
キャリッジリターンの一致は、x0d または cM と同等です
t は、x09 または cl に相当するタブ文字と一致します。
v x0b または ck に相当する垂直タブ文字と一致します。
oNN は 8 進数に一致します
xNN は 16 進数と一致します
cC 制御文字と一致します
パターン修飾子:
パターン修飾子は、大文字と小文字を無視したり、複数の行を一致させる場合に特に使用されます。この修飾子をマスターすると、遭遇する多くの問題が解決されることがあります。
i - 大文字と小文字の両方に一致します
M - 文字列を複数行として扱います
S - 文字列を単一行として扱い、改行を通常の文字として扱い、「.」を任意の文字と一致させます
X - パターン内の空白は無視されます
U - 最も近い文字列と一致します
e - 置換された文字列を式として使用します
形式: /apple/i は、大文字と小文字を区別せずに、「apple」または「Apple」などと一致します。 /私
PCREのパターンユニット:
//1 最初の属性を抽出します
/^d{2} ([W])d{2}1d{4}$ は、「12-31-2006」、「09/27/1996」、「86 01 4321」などの文字列に一致します。しかし、上記の正規表現は「12/34-5678」の形式と一致しません。これは、パターン「[W]」の結果「/」がすでに格納されているためです。次の位置「1」が を参照する場合、その一致パターンも文字「/」になります。
マッチング結果を保存する必要がない場合は、非保存パターンユニット「(?:)」を使用してください
たとえば、/(?:a|b|c)(D|E|F)1g/ は「aEEg」と一致します。一部の正規表現では、非ストレージ モード単位を使用する必要があります。それ以外の場合は、後続の参照の順序を変更する必要があります。上記の例は、/(a|b|c)(C|E|F)2g/ と書くこともできます。
PCRE正規表現関数:
preg_match() と preg_match_all()
preg_quote()
preg_split()
preg_grep()
preg_replace()
関数の具体的な使用法については、PHP マニュアルを参照してください。ここでは、私たちが蓄積した正規表現をいくつか紹介します。
アクション属性の一致
$str = '';
$match = '';
preg_match_all(’/s+action="(?!http:)(.*?)"s/’, $str, $match);
print_r($match);
正規表現でコールバック関数を使用する
/**
* 一部の文字列をコールバック関数で置き換えます
*
*/
関数 callback_replace() {
$url = ‘http://esfang.house.sina.com.cn’;
$str = '';
$str = preg_replace ( '/(?<=saction=")(?!http:)(.*?)(?="s)/e', 'search($url, 1)', $str ) ;
エコー $str;
}
関数検索($url, $match){
$url を返します。
}
アサーションとの定期的なマッチング
$match = '';
$str = ’xxxxxx.com.cn 太字フォント
段落テキスト
』;
preg_match_all ( ’/(?).*(?=1>)/’, $str, $match );
echo "属性を持たない HTML タグのコンテンツと一致します:";
print_r ($match);
HTMLソースコード内のアドレスを置き換えます
$form_html = preg_replace ( '/(?<=saction="|ssrc="|shref=")(?!http:|javascript)(.*?)(?="s)/e', 'add_url( $url, '1')', $form_html );
最後に、通常のツールは強力ですが、効率と作成時間の観点からは、緊急のタスクや要求の少ないタスクの場合は、単純で大雑把な方法の方が適している場合があります。
preg と ereg の 2 つのシリーズの実行効率については、preg の方が速いという記事を見たことがあります。特に ereg はあまり使用されておらず、これから歴史の舞台に登場するので、私も ereg の方が好きです。 PCREのやり方
http://www.bkjia.com/PHPjc/371549.html
www.bkjia.com
true
http://www.bkjia.com/PHPjc/371549.html
技術記事