博客列表 >字符串函数

字符串函数

Mryang的博客
Mryang的博客原创
2020年04月26日 16:16:29942浏览

字符串函数

[toc]

1. 字符串语法

  • 字符串上限: 2G
  • 字符串中每个字符使用一个字节表示,仅支持 256 个,不支持Unicode

  • 有四种方式创建字符串

序号 方式 描述
1 单引号 全部内容视为纯文本
2 双引号 可解析变量和转义特殊字符
3 heredoc 与双引号类似
4 nowdoc 与单引号类似

1.1 单引号

单引号 转义符 特殊字符 变量
转义 转义 不转义 不解析

1.2 双引号

  • 双引号对内容的处理
双引号 转义符 特殊字符 变量
转义 转义 转义 解析
  • 双引号中的变量, 应该使用大括号{}限定标识符识别范围,如: “{\$email}”
  • 双引号中的特殊字符列表
序号 特殊字符 描述
1 \n 换行(ASCII 字符集中的 LF 或 0x0A (10))
2 \r 回车(ASCII 字符集中的 CR 或 0x0D(13))
3 \t 水平制表符(ASCII 字符集中的 HT 或 0x09 (9))
4 \v 垂直制表符(ASCII 字符集中的 VT 或 0x0B (11))(自 PHP 5.2.5 起)
5 \e Escape(ASCII 字符集中的 ESC 或 0x1B (27))(自 PHP 5.4.0 起)
6 \f 换页(ASCII 字符集中的 FF 或 0x0C (12))(自 PHP 5.2.5 起)
7 \\ 反斜线
8 \$ 美元标记
9 \" 双引号
10 \[0-7]{1,3} 符合该正则表达式序列的是一个以八进制方式来表达的字符
11 \x[0-9A-Fa-f]{1,2} 符合该正则表达式序列的是一个以十六进制方式来表达的字符

1.3 heredoc

双引号 转义符 特殊字符 变量
不转义 不转义 转义 解析

1.4 nowedoc

单引号 转义符 特殊字符 变量
不转义 不转义 不转义 不解析

2. 打印输出函数

序号 函数 说明
1 echo 输出一个或多个字符串
2 print 输出字符串
3 printf 输出格式化字符串
4 vprintf 与 printf()区别在于参数在数组中
5 sprintf 返回格式化字符串,存入变量/文件中
6 vsprintf 与 sprintf()区别在于参数在数组中
7 fprintf 将格式化字符串写入文件流中
8 vfprintf 与 fprintf()区别在于参数使用数组
9 sscanf 根据指定格式解析输入的字符
10 number_format 以千位分隔符方式格式化一个数字

3 分割查询与替换函数

3.1 第一组

序号 函数 说明
1 implode 将一个一维数组的值转化为字符串
2 join 别名 implode
3 explode 使用一个字符串分割另一个字符串
5 substr 返回字符串的子串
6 substr_count 计算字串出现的次数
7 substr_replace 替换字符串的子串
8 str_split 将字符串转换为数组
9 str_getcsv 解析 CSV 字符串为一个数组

3.2 第二组

序号 函数 说明
10 str_pad 使用另一个字符串填充字符串为指定长度
11 str_repeat 重复一个字符串
12 str_replace 子字符串替换
13 str_ireplace str_replace 的忽略大小写版本
14 strtr 转换指定字符
15 str_shuffle 随机打乱一个字符串
16 wordwrap 打断字符串为指定数量的字串
17 trim 去除字符串首尾处的空白字符(或者其他字符)
18 rtrim 删除字符串末端的空白字符(或者其他字符)
19 ltrim 删除字符串开头的空白字符(或其他字符)
20 chop rtrim 的别名

附录 1: trim()/ltrim()/rtrim()去除的空白符列表

序号 空白符 描述
1 " " (ASCII 32 (0x20)),普通空格符
2 "\t" (ASCII 9 (0x09)),制表符
3 "\n" (ASCII 10 (0x0A)) 换行符
4 "\r" (ASCII 13 (0x0D))回车符
5 "\0" (ASCII 0 (0x00))空字节符
6 "\x0B" (ASCII 11 (0x0B))垂直制表符

3.3 第三组

序号 函数 说明
21 strpos 查找字符串首次出现的位置
22 stripos 查找字符串首次出现的位置(忽略大小写)
23 strripos 计算指定字符串在目标字符串中最后一次出现的位置(忽略大小写)
24 strrpos 计算指定字符串在目标字符串中最后一次出现的位置)
25 strstr 查找字符串的首次出现
26 stristr strstr 函数的忽略大小写版本
27 strrchr 查找指定字符在字符串中的最后一次出现
28 strchr 别名 strstr
29 strpbrk 在字符串中查找一组字符的任何一个字符
30 strspn 计算字符串中全部字符都存在于指定字符集合中的第一段子串的长度
31 strtolower 将字符串转化为小写
32 strtoupper 将字符串转化为大写
33 lcfirst 使一个字符串的第一个字符小写
34 ucfirst 将字符串的首字母转换为大写
35 ucwords 将字符串中每个单词的首字母转换为大写
36 strlen 获取字符串长度
37 strrev 反转字符串
38 strip_tags 从字符串中去除 HTML 和 PHP 标记

4. URL 处理函数

序号 函数 说明
1 parse_str 将字符串解析成多个变量,处理 url
2 parse_url 解析 URL,返回其组成部分
3 http_build_query 生成 URL-encode 之后的请求字符串
4 urldecode 解码已编码的 URL 字符串
5 urlencode 编码 URL 字符串
6 base64_encode MIME base64 数据解码
7 base64_decode MIME base64 数据编码

附录 1: $_SERVER预定义变量

以 URL 为例: http://php.io/case/demo12.php/m/admin/c/add?id=5&name=admin

序号 变量 描述 示例
1 UNIQUE_ID HTTP 请求的唯一标识符 Xn4DhH8AAAEAAAWiEO0AAAAB
2 HTTP_HOST HTTP 主机名/域名 php.io
3 SERVER_ADDR HTTP 主机名 IP 地址 127.0.0.1 / 0:0:0:1 / ::1
4 SERVER_PORT Web 服务器使用的端口 80
5 REMOTE_PORT 用户机器连接到 Web 服务器的端口号 52706
6 SERVER_NAME Appcha 配置的 ServerName php.io
7 DOCUMENT_ROOT 当前脚本所在的根目录(配置文件中) /Documents/web/php/case
8 SCRIPT_FILENAME 当前执行脚本的绝对路径 /Documents/web/php/case/demo1.php
9 SCRIPT_NAME 当前执行脚本的路径与文件名 /case/demo1.php
10 PHP_SELF 当前脚本名(含 pathinfo) /case/demo1.php/m/admin/c/add
11 PATH_INFO 执行脚本与查询字符串之间的路径信息 /m/admin/c/add
12 PATH_TRANSLATED 脚本所在文件系统路径(限 pathinfo) /Documents/web/php/m/admin/c/add
13 REQUEST_URI 当前访问的 URL(pathinfo,查询字符串) case/demo1.php/m/admin/c/add?id=5&…
14 QUERY_STRING 查询字符串(不含前导问号?) id=5&name=admin
15 REQUEST_METHOD HTTP 请求类型 POST / GET
16 HTTP_REFERER 引导用户进入当前页面的 URL 如果是直接进入当前页,则不存在该值
17 HTTP_USER_AGENT 客户端/浏览器信息get_browser() Mozilla/5.0 (Macintosh; Intel Mac …
18 SERVER_SOFTWARE web 服务器软件 Apache
19 SERVER_PROTOCOL web 服务器 HTTP 协议 HTTP/1.1
20 GATEWAY_INTERFACE 网关接口:服务器使用 CGI 规范 CGI/1.1
21 REQUEST_TIME HTTP 请求开始的时间戳 1585320730
22 REQUEST_TIME_FLOAT HTTP 请求开始的时间戳(微秒级) 1585320730.803
23 argv 传递给脚本的参数数组 Array ( [0] => id=5&name=admin )
24 argc 传递给脚本的参数数量 1
25 HTTP_ACCEPT 客户端请求/接受文档类型 text/html,application/xhtml+xml,appli…
26 HTTP_ACCEPT_ENCODING HTTP 压缩 HTML 的编码方式 gzip, deflate
27 HTTP_ACCEPT_LANGUAGE HTTP 接受的语言 zh-CN,zh;q=0.9,en;q=0.8,ja;q=0.7

附录 2: urlencode():对 url 变量值进行编码

除了-\_.之外的所有字符 空格 编码方式
%+2 位 16 进制数 + application/x-www-form-urlencoded

附录 3: base64_encode():用 base64 对 data 进行编码

  • 为了使二进制数据可以通过非纯 8-bit 的传输层传输,例如电子邮件的主体
  • 下载链接, 图片等都可以使用它进行加密处理
  • 加密之后的数据比原始数据要多占据 33%的空间大小

附录 4: Data URI Scheme(协议)

形如:data:text/jpeg;base64,/9j/4AAQSkZJRgABA... 这样的资源链接

序号 协议 说明
1 data: 文本数据
2 data:text/plain, 文本数据
3 data:text/html, HTML 代码
4 data:text/css;base64, css 代码
5 data:text/javascript;base64, javascript 代码
6 data:image/x-icon;base64, base64 编码的 icon 图片数据
7 data:image/gif;base64, base64 编码的 gif 图片数据
8 data:image/png;base64, base64 编码的 png 图片数据
9 data:image/jpeg;base64, base64 编码的 jpeg 图片数据

5. HTML 相关

序号 函数 说明
1 htmlspecialchars 将特殊字符转换为 HTML 实体
2 htmlspecialchars_decode 将特殊的 HTML 实体转换回普通字符
3 htmlentities 将字符转换为 HTML 转义字符
4 html_entity_decode 将 HTML 实体转换为它们相应的字符
5 nl2br 在字符串所有新行之前插入 HTML 换行标记

附录 1: html 实体字符

  • 某些字符在 html 文档中有特殊意义,如<>用表示元素标签,这些都是预留字符,不能直接使用
  • 如果要在 html 文档中正确显示他们,需要将它们转为html 实体字符,如<转为&lt;
  • html 实体字符有二种表示方法: 1. 命名表示法,如&lt;, 2. 编码表示法, 如&60;
  • 常用实体字符列表:
序号 描述 实体名称 实体编码
1 ' ' 空格 &nbsp; &#160;
2 < 小于号 &lt; &#60;
3 > 大于号 &gt; &#62;
4 & 和号 &amp; &#38;
5 " 双引号 &quot; &#34;
6 ' 单引号 &apos; &#39;
7 分(cent) &cent; &#162;
8 `` 镑(pound) &pound; &#163;
9 ¥ 元(yen) &yen; &#165;
10 欧元(euro) &euro; &#8364;
11 § 小节 &sect; &#167;
12 © 版权(copyright) &copy; &#169;
13 ® 注册商标 &reg; &#174;
14 商标 &trade; &#8482;
15 × 乘号 &times; &#215;
16 ÷ 除号 &divide; &#247;

附录 2: htmlspecialchars()转换字符列表

序号 原字符 替换成
1 & &amp;
2 " &quot;
3 ' &#039;
4 < &lt;
5 > &gt;

如果要转换的字符超出以上列表,请使用: htmlentities()

附录 3: 转换时的 FLAG 常量

序号 常量 描述
1 ENT_COMPAT 会转换双引号,不转换单引号
2 ENT_QUOTES 既转换双引号也转换单引号
3 ENT_NOQUOTES 单/双引号都不转换
4 ENT_SUBSTITUTE 替换无效的代码单元序列为 Unicode 代替符
5 ENT_DISALLOWED 为文档的无效代码点替换为 Unicode 代替符
6 ENT_HTML401 以 HTML 4.01 处理代码
7 ENT_XML1 以 XML 1 处理代码
8 ENT_XHTML 以 XHTML 处理代码
9 ENT_HTML5 以 HTML 5 处理代码

6. 转码相关函数

序号 函数 说明
1 chr 返回指定的字符
2 ord 转换字符串第一个字节为 0-255 之间的值
3 chunk_split 将字符串分割成小块
4 bin2hex 函数把包含数据的二进制字符串转换为十六进制值
5 hex2bin 转换十六进制字符串为二进制字符串
7 convert_uuencode 将所有(含 2 进制)字符串转为可打印字符便于网络安全传输
6 convert_uudecode 将 convert_uuencode 编码的字符串解析还原(反操作)
8 count_chars 返回字符串所用字符的信息(每个字符出现的次数)
9 quotemeta 转义元字符集: . \ + * ? [ ^ ] ( $ )
  • count_chars() 的模式符:
序号 模式符 说明
1 0 以所有的每个字节值作为键名, 出现次数作为值的数组
2 1 与 0 相同,但只列出出现次数大于零的字节值
3 2 与 0 相同,但只列出出现次数等于零的字节值
4 3 返回由所有使用了的字节值组成的字符串
5 4 返回由所有未使用的字节值组成的字符串
  • quotemeta(): 预定义的字符前添加反斜线\
  • 预定义字符列表(在正则中具有特殊语义)
序号 字符 说明
1 . 圆点
2 \ 反斜线
3 + 加号
4 * 星号
5 ? 问号
6 [] 方括号
7 ^ 脱字符
8 $ 美元符
9 () 圆括号

7. 哈希相关函数

序号 函数 说明
1 md5_file 计算指定文件的 MD5 散列值
2 md5 计算字符串的 MD5 散列值
3 sha1_file 计算文件的 sha1 散列值
4 sha1 计算字符串的 sha1 散列值
5 crypt 单向字符串散列
6 crc32 计算一个字符串的 crc32 多项式
7 str_rot13 对字符串执行 ROT13 转换

8. 统计与比较函数

序号 函数 说明
1 strspn 返回字符串与掩码中字符串匹配的字符数量
2 strcspn 返回第一个字符串中, 找到与掩码字符之前的字符数量
3 str_word_count 返回字符串中单词的使用情况
4 substr_compare 二进制安全比较字符串(从偏移位置比较指定长度)
5 strcmp 二进制安全字符串比较
6 strncmp 二进制安全比较字符串开头的若干个字符
7 strcasecmp 二进制安全比较字符串(不区分大小写)
8 strncasecmp 二进制安全比较字符串开头的若干个字符(不区分大小写)
声明:本文内容转载自脚本之家,由网友自发贡献,版权归原作者所有,如您发现涉嫌抄袭侵权,请联系admin@php.cn 核实处理。
全部评论
文明上网理性发言,请遵守新闻评论服务协议