PHP での正規表現の実現

WBOY
WBOYオリジナル
2016-06-13 13:18:49827ブラウズ

PHP での正規表現の検証

検証はどこのウェブマスターにとっても共通の関心事です。誰かがフォームに情報を入力した場合は、それを確認する必要があります。しかし、これを行う最も簡単な方法は何でしょうか?

そうですね、従う必要がある大量のテキスト パターンを扱うときは、私は常に正規表現を利用します。正規表現はパターンを定義する方法です。 Regex については教えませんが、PHP の正規表現については説明します。 PHP は主に Perl の正規表現を使用します。これが、PHP の正規表現に対して関数 preg_match を実行する理由です。 Perl 正規表現マッチングを実行するにはどうすればよいですか?いずれにしても、PHP のパターンに追加してパフォーマンスに影響を与える特定の修飾子が存在します。たとえば、「i」では大文字と小文字が区別されません。大文字と小文字を区別する正規表現パターンを使用すると、読みやすさが低下するため、電子メール アドレス パターンを使用してこれを行う必要がありました。次に、複数行の件名、実際には複数のライナーを処理する「m」修飾子があります。それ以外の場合、それらは無視され、改行 (N) とアンカー (^ と $) はトピック全体の始まりと終わりを意味するとみなされます。 「S」は、^ で始まらず、一貫した開始文字がない正規表現パターンを頻繁に使用する場合に便利です。念のため、ユーザー名、パスワード、確認用パスワードが正しければ、英数字のみが使用可能だと思いました。したがって、潜在的なバグの可能性のあるすべての文字を検索するのではなく、文字ではない文字を検索します。これは、文字クラスの文字 ^ で表されます。 [:^A-ZA-Z0-9]。その後、一致するものがあれば、フィールドに無効な文字があることがわかります。また、正規表現ではエスケープする必要があるメタ文字があることにも注意してください。 preg_quote の電子メールと URL の値に対する私の提案は、特にこれらの標準を定義するのが難しいため、より困難です。たとえば、正規表現.info では、電子メールの正規表現についてかなり長い議論が行われています。技術的には、有効な電子メール アドレスには一重引用符を含めることができます。ほとんどの電子メール アドレスのリストは有効です。 URL には同様の質問が含まれています。トップレベル ドメインは多数あり、リストを作成するのは困難です。また、「http://software8.co」ではなく「software8.co」とだけ言う傾向もあります。 「google.co.uk」のように、トップレベル ドメインに国の値も含まれる場合もありますが、できるだけ多くを含めることはお勧めしません。全員に会おうとすると、検証に多くの時間を費やしてしまい、それはもはや不可能です。ユーザーが入力する内容に基づいてではなく、便宜的に入力された内容に基づいて、コード内のユーザー入力を検証します。さらに、正規表現はすべての問題を解決できるわけではありません (ただし、ほとんどの問題は解決できます)。例外が多いものや非常に複雑なものを検証したい場合、それは大変な作業になります。日付と時刻の形式を設定しようとすることさえ想像できません。正午ですか、それとも真夜中ですか? 12:60は有効ですか? 17時くらいでしょうか? AMとPMを入力する必要がありますか? 3 ということは両方とも 3:00 ということですか?こうしたことは人間に任せるか、あるいはあなたが考案できる他の方法に任せるのが最善です。

<?php



$un = $_POST["user"];

$pw = $_POST["pass"];

$pw2 = $_POST["pass2"];

$em = $_POST["email"];

$url = $_POST["url"];



$info = array($un, $pw, $pw2, $em, $url);



foreach ($info as $idx => $unit) {

        switch ($idx) {

                case 4:

$rgx = "/^((ftp|http|https)://(w&#43;:{0,1}w*@)?)?(S&#43;)(:[0-9]&#43;)?(/|/([w#!:.?&#43;=&%@!-/]))?$/";

                break;



                case 3:

                        $rgx = "/^[A-Z0-9._%&#43;-]&#43;@[A-Z0-9.-]&#43;.[A-Z]{2,4}$/i";

                break;



                case 2:

                        //read below

                        $rgx = "/[^A-Za-z0-9]&#43;/";

                break;



                case 1:

                        //read below

                        $rgx = "/[^A-Za-z0-9]&#43;/";

                break;



                case 0:

                        //if characters are NOT normal

                        $rgx = "/[^A-Za-z0-9]&#43;/";

                break;



                default:

                        echo "???";

                        die("$unit ?");

                break;

        }



        $n = preg_match($rgx, $unit, $matches);

        if ( ($idx == 0) || ($idx == 1) || ($idx == 2) ){

        	    if ($n) {

                        echo "Bad Characters in $unit; Alphanumeric only<br />";

                }

        } else {

                if ($n == 0) {

                        echo "Incorrect Format in $unit; Enter Valid Info<br />";

                }

        }

}



?>
声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。