Home >Backend Development >PHP Tutorial >php中字符串和正则表达式详解_PHP

php中字符串和正则表达式详解_PHP

WBOY
WBOYOriginal
2016-05-31 19:29:04893browse

一、字符串类型的特点

1、PHP是弱类型语言,其他数据类型一般都可以直接应用于字符串函数操作。

echo substr("123456",2,4);  //输出345<br>echo substr(123456,2,4);    //输出345<br>echo hello;                 //先查找hello常量,若没找到,将hello看做字符串使用<br>?>

2、字符串可以作为“数组”,是字符的集合。

$str = "www.bitsCN.com";<br>echo $str[0];<br>echo $str[1];<br>echo $str[2];<br>?>

但是字符串不是真的数组,不能使用数组的函数.如count($str)不会返回字符串长度。PHP引擎无法区分字符和数组,产生二义性。自PHP4起,已经用花括号替代方括号。

//为保证向后兼容,方括号仍然可以使用<br>$str = www.bitsCN.com;<br>echo $str{0};<br>echo $str{1};<br>echo $str{2};<br>?>

3、双引号变量解析

在PHP中,当用双引号或者定界符定义字符串时,其中的变量会被解析。

$arr = array('name' => "dwqs",'add' => "www.ido321.com");<br>echo "$arr[name]";  //可以解析,但是在方括号中不能使用引号<br>//echo "$arr['name']";  错误<br>echo "{$arr['name']}";  //可以解析,用花括号包含元素,name不带引号也是可以的<br>//假设存在对象$square<br>echo "$square->width"; //可以解析<br>echo "$square->width00 cent"; //不可以解析,用花括号解决<br>echo "{$square->width}width00 cent"; //可以解析<br>?>

二、字符串输出函数

三、常用的字符串格式函数

PS:PHP的字符串处理函数大部分不对源字符串做修改,而是返回新的字符串

四、正则表达式

正则表达式描述了一种字符串匹配的模式,通过这个模式在特定的函数中对字符串进行匹配、查找、替换和分隔等操作,由原子、元字符和模式修正符三部分组成的文字模式。

在PHP中,有两套正则的处理函数库:PCRE和POSIX。前者以preg_前缀命名,与Perl兼容;后者以ereg_前缀命名。二者功能相似,但PCRE的效率略高。

与Perl语言兼容的正则表达式处理函数:

1、语法

1.1 定界符:在与Perl兼容的正则函数中使用模式时,必须给模式加上定界符。除了字母、数字和反斜线(\)之外的任何字符都可以作为定界符号

//以下正则合法<br>echo $m1 = '/echo $m2 = '|(\d{3})-\d|Sm';<br>echo $m3 = '!^(?i)php[34]!';<br>echo $m4 = '{^\s+(\s+)?$}';<br>?>

1.2 原子:原子包含了普通字符,如字母、数字;非打印字符,如空格、回车;特殊字符和元字符,如引号、*、+等,必须用”\”进行转义;自定义原子表,如[apj]、[a-z];通用字符类型,如\d、\D。

//下面二者等价,匹配e-mail<br>$mail1 = '/^[0-9a-zA-Z]+@[0-9a-zA-Z]+(\.[0-9a-zA-Z]+){0,3}$/';<br>$mail2 = '/^\w+@\w+(\.\w+){0,3}$/';<br>?>

1.3 元字符:用于构建正则表达式的具有特殊含义的字符。Perl可以使用各种元字符来搜索匹配,如*、+、?.常见的元字符如下

1.4 模式修正符:在正则的定界符之外使用,扩展正则在匹配、替换等方面的功能。

2.与Perl兼容的正则表达式函数

2.1 preg_match(string pattern,string subject[,array matches]):用于对字符串的查找和匹配。参数说明:

pattern是正则,subject是需要处理的字符串,可选的matches用于保存于pattern的各个子模式的匹配结果,matches[0]保存了与pattern匹配的整体内容,matches[1]保存了pattern中第一个小括号中匹配的内容,以此类推。

header("content-type:text/html;charset=utf8");<br>$pattern = '/(http):\/\/(www)\.([^\.\/]+)\.(com|net|org)/i';<br>$subject = "我的博客:http://www.ido321.com";<br>if(preg_match($pattern, $subject,$matches)){<br>echo "搜索的URL是:".$matches[0]."<br>";  //数组第1个元素保存整个匹配结果<br>echo "URL中的协议是:".$matches[1]."<br>";//数组第2个元素保存第1个字表达式<br>echo "URL中的主机是:".$matches[2]."<br>";//数组第3个元素保存第2个字表达式<br>echo "URL中的域名是:".$matches[3]."<br>";//数组第4个元素保存第3个字表达式<br>echo "URL中的顶域是:".$matches[4]."<br>";//数组第5个元素保存第4个字表达式<br>}<br>?>

结果

preg_match_all()与preg_match()函数类似,不同的是前者会一直匹配到字符串末尾,后者在第一次匹配后就停止匹配。

2.2 preg_grep(string pattern,array iput):匹配数组中的元素,返回与正则匹配的数组单元。参数说明:

pattern是正则,input是需要匹配的数组。

$arr = array('Linux RedHat9.0','Apache2.2.9','MySQL5.0.51','PHP5.2.6','LAMP','100');<br>$version = preg_grep('/^[a-zA-Z]+(\d|\.)+$/',$arr);<br>//输出:Array([1]=>Apache2.2.9 [2]=>MySQL5.0.51 [3]=>PHP5.2.6)<br>print_r($version); <br>?>

2.3 preg_replace(mixed pattern,mixed replacement,mixed subject[,int limit]):字符串替换。说明:

该函数会在subject中搜索与pattern的匹配项,并用replacement替换。limit用于限制匹配的次数,即替换的次数。

$pattern = '/]*?/is';<br>$text = '这个文本有<b>粗体</b>和<u>带有下划线</u>以及<i>斜体</i>';<br>echo preg_replace($pattern,"",$text);  //将所有HTML标记替换为空<br>echo preg_replace($pattern,"",$text,2); //值替换前2个HTML标记<br>?>

2.4 preg_split(string pattern,string subject[,int limit[,int flags]]):对字符串进行分割。说明:

函数返回一个数组。数组元素包含subject中与pattern匹配作为边界所分割的字符串,limit含义见2.3,flags含义请参考文档。

//按任数量的空格分割字符串<br>$kerwords = preg_split("/[\s,]+/","hypertext language,programming");<br>//输出:Array([0]=>hypertext [1]=>language,[2[=>programming)<br>print_r($kerwords);<br>?>
Statement:
The content of this article is voluntarily contributed by netizens, and the copyright belongs to the original author. This site does not assume corresponding legal responsibility. If you find any content suspected of plagiarism or infringement, please contact admin@php.cn