文章收藏了大量在mysql开发或应用中会碰到的一些有用的字符串操作函数介绍给各位,有需要了解的朋友可参考一下。
()函数可以获得一个字符串的长度:
select length('abcdefg'),length('0123456789');
/*
+-------------------+----------------------+
| length('abcdefg') | length('0123456789') |
+-------------------+----------------------+
| 7 | 10 |
+-------------------+----------------------+
1 row in set (0.00 sec)
*/使用RPAD()或者LPAD()函数可以分别从右边或者左边对字符串进行填补:
一般,字符串经常用空格进行填补(就是所谓的补齐),MySQL可以通过给RPAD()和LPAD()函数中指定一个自定义值作为第三个参数对字符串进行填补。
select rpad('simaopig',17,''),rpad('simaopig',17,'@'),lpad('simaopig',17,''),lpad('simaopig',17,'@');
/*
+------------------------+-------------------------+------------------------+-------------------------+
| rpad('simaopig',17,'') | rpad('simaopig',17,'@') | lpad('simaopig',17,'') | lpad('simaopig',17,'@') |
+------------------------+-------------------------+------------------------+-------------------------+
| NULL | simaopig@@@@@@@@@ | NULL | @@@@@@@@@simaopig |
+------------------------+-------------------------+------------------------+-------------------------+
1 row in set (0.00 sec)
*/
select rpad('simaopig',17,' '),rpad('simaopig',17,'@'),lpad('simaopig',17,' '),lpad('simaopig',17,'@');
/*
+-------------------------+-------------------------+-------------------------+-------------------------+
| rpad('simaopig',17,' ') | rpad('simaopig',17,'@') | lpad('simaopig',17,' ') | lpad('simaopig',17,'@') |
+-------------------------+-------------------------+-------------------------+-------------------------+
| simaopig | simaopig@@@@@@@@@ | simaopig | @@@@@@@@@simaopig |
+-------------------------+-------------------------+-------------------------+-------------------------+
1 row in set (0.00 sec)
*/LTRIM()和RTRIM()函数产生与填补相反的效果,去除字符串的首和尾字符:
select ltrim('simaopig '),ltrim(' simaopig'),rtrim('simaopig '),rtrim(' simaopig'),ltrim(rtrim(' simaopig '));
/*
+----------------------+---------------------------+----------------------+--------------------------+----------------------------------+
| ltrim('simaopig ') | ltrim(' simaopig') | rtrim('simaopig ') | rtrim(' simaopig') | ltrim(rtrim(' simaopig ')) |
+----------------------+---------------------------+----------------------+--------------------------+----------------------------------+
| simaopig | simaopig | simaopig | simaopig | simaopig |
+----------------------+---------------------------+----------------------+--------------------------+----------------------------------+
1 row in set (0.00 sec)
*/即然谈到了“空格”,那么把书中的例子再抄一遍,那就是MySQL提供了一个函数,这个函数(SPACE())的功能是只返回空格
select space(1),space(4),length(space(1)),length(space(4));
/*
+----------+----------+------------------+------------------+
| space(1) | space(4) | length(space(1)) | length(space(4)) |
+----------+----------+------------------+------------------+
| | | 1 | 4 |
+----------+----------+------------------+------------------+
1 row in set (0.00 sec)
*/TRIM()函数可以指定去除格式,并且可以指定是去除左边还是右边?或者去除其它字符(不发局限于空格):
其实啊,就是把RTRIM()和LTRIM()的活都做了,而且做的好,可以说TRIM()和RTRIM()是TRIM()的子集。。。
select trim(' simaopig '),length(trim(' simaopig ')) as len;
/*
+--------------------+-----+
| trim(' simaopig ') | len |
+--------------------+-----+
| simaopig | 8 |
+--------------------+-----+
1 row in set (0.00 sec)
*/
select trim(leading '!' from '!!!simaopig!!!') as trim_leading,trim(trailing '!' from '!!!simaopig!!!') as trim_trailing,trim(both '!' from '!!!simaopig!!!') as trim_both;
/*
+--------------+---------------+-----------+
| trim_leading | trim_trailing | trim_both |
+--------------+---------------+-----------+
| simaopig!!! | !!!simaopig | simaopig |
+--------------+---------------+-----------+
1 row in set (0.00 sec)
*/LEFT()和RIGHT()函数可以获得字符串的指定部分,它将从字符串的左边或右边返回字符:
select left('simaopig',5) as left_five,right('simaopig',5) as right_five,left(right('simaopig',7),5) as midd_five;
/*
+-----------+------------+-----------+
| left_five | right_five | midd_five |
+-----------+------------+-----------+
| simao | aopig | imaop |
+-----------+------------+-----------+
1 row in set (0.00 sec)
*/SUBSTRING()函数,允许指定一个字符串的长度和起始位置,也是获取子字符串:
注意哈,这里的MySQL的字符串起始位置是1,不是零哈。
select substring('simaopig',2,3);
/*
+---------------------------+
| substring('simaopig',2,3) |
+---------------------------+
| ima |
+---------------------------+
1 row in set (0.00 sec)
*/CONCAT()函数使其内提供的参数连接起来:
如果CONCAT()的参数是空的,其结果也是空的(NULL)。
select concat('welcome','to','小小子'),concat('simaopig',NULL);
/*
+------------------------------------+-------------------------+
| concat('welcome','to','小小子') | concat('simaopig',NULL) |
+------------------------------------+-------------------------+
| welcometo小小子 | NULL |
+------------------------------------+-------------------------+
1 row in set (0.00 sec)
*/CONCAT_WS()函数与CONCAT()函数基本相同,只是其还可以提供一个参数作为连接后字符串的分隔符:
select concat_ws(',','welcome','to','xiaoxiaozi.com') as con_wel,concat_ws(' ','Simaopig','Love','Yatou') as con_love;
/*
+---------------------------+---------------------+
| con_wel | con_love |
+---------------------------+---------------------+
| welcome,to,xiaoxiaozi.com | Simaopig Love Yatou |
+---------------------------+---------------------+
1 row in set (0.00 sec)
*/使用LOCATE()函数检验一个字符串是否包含所要检测的字符串,如果存在,返回其第一次出现的位置:
今天,第二次强调。MySQL字符串起始位置为1,不是零。
select locate('pig','simaopig'),locate('','simaopig'),locate(' ','simaopig'),locate(' ',' simaopig ');
/*
+--------------------------+-----------------------+------------------------+--------------------------+
| locate('pig','simaopig') | locate('','simaopig') | locate(' ','simaopig') | locate(' ',' simaopig ') |
+--------------------------+-----------------------+------------------------+--------------------------+
| 6 | 1 | 0 | 1 |
+--------------------------+-----------------------+------------------------+--------------------------+
1 row in set (0.00 sec)
*/FIND_IN_SET()函数是在一个大集合中查找指定的字符串:
在MySQL中看到set就应该想到集合!!!
select find_in_set('simaopig','My,Name,Is,Simaopig,You,Can,Call,Me,simaopig,Too') as string_locate;
/*
+---------------+
| string_locate |
+---------------+
| 4 |
+---------------+
1 row in set (0.00 sec)
*/哈,看到了吧,其返回的是该字符串是集合的第几个元素,嗯。
你还问为啥大写的也返回了?呃,因为我没有用binary啊。
STRCMP()函数比较两个字符串是否相同,相同返回0,如果第一个大于第二个返回1,否则返回-1:
呃,同样的,不加binary的话,字符串比较是不区分大小写的。
select strcmp('a','b'),strcmp('b','a'),strcmp('a','a'),strcmp('a','A'),strcmp('a','B');
/*
+-----------------+-----------------+-----------------+-----------------+-----------------+
| strcmp('a','b') | strcmp('b','a') | strcmp('a','a') | strcmp('a','A') | strcmp('a','B') |
+-----------------+-----------------+-----------------+-----------------+-----------------+
| -1 | 1 | 0 | 0 | -1 |
+-----------------+-----------------+-----------------+-----------------+-----------------+
1 row in set (0.00 sec)
*/REPLACE()函数和在别的编程语言里的用法一致,替换功能:
select replace('I am simaopig','simaopig','xiaoxiaozi');
/*
+--------------------------------------------------+
| replace('I am simaopig','simaopig','xiaoxiaozi') |
+--------------------------------------------------+
| I am xiaoxiaozi |
+--------------------------------------------------+
1 row in set (0.00 sec)
*/INSSERT()函数可以把一个字符串的指定部分(定义了起始位置和长度)替换为一个新值:
select insert('I am simaopig',6,8,'xiaoxiaozi');
/*
+------------------------------------------+
| insert('I am simaopig',6,8,'xiaoxiaozi') |
+------------------------------------------+
| I am xiaoxiaozi |
+------------------------------------------+
1 row in set (0.00 sec)
*/REPEAT()函数用于重复字符串操作:
例如:输出十遍’xiaoxiaozi’
select repeat('xiaoxiaozi',10);
/*
+------------------------------------------------------------------------------------------------------+
| repeat('xiaoxiaozi',10) |
+------------------------------------------------------------------------------------------------------+
| xiaoxiaozixiaoxiaozixiaoxiaozixiaoxiaozixiaoxiaozixiaoxiaozixiaoxiaozixiaoxiaozixiaoxiaozixiaoxiaozi |
+------------------------------------------------------------------------------------------------------+
1 row in set (0.00 sec)
*/REVERSE()函数颠倒字符串:
select reverse('simaopig'),reverse(repeat('hello ',6));
/*
+---------------------+--------------------------------------+
| reverse('simaopig') | reverse(repeat('hello ',6)) |
+---------------------+--------------------------------------+
| gipoamis | olleh olleh olleh olleh olleh olleh |
+---------------------+--------------------------------------+
1 row in set (0.00 sec)
*/UCASE()和LCASE()将字符串分别转化为大写和小写:
select ucase('simaopig'),ucase('Simaopig'),lcase('SIMAOPIG'),lcase('simaopiG');
/*
+-------------------+-------------------+-------------------+-------------------+
| ucase('simaopig') | ucase('Simaopig') | lcase('SIMAOPIG') | lcase('simaopiG') |
+-------------------+-------------------+-------------------+-------------------+
| SIMAOPIG | SIMAOPIG | simaopig | simaopig |
+-------------------+-------------------+-------------------+-------------------+
1 row in set (0.00 sec)
*/ASCII()函数返回指定字符的ASCII码:
select ascii('y'),ascii('Simaopig'),ascii('simaopig');
/*
+------------+-------------------+-------------------+
| ascii('y') | ascii('Simaopig') | ascii('simaopig') |
+------------+-------------------+-------------------+
| 121 | 83 | 115 |
+------------+-------------------+-------------------+
1 row in set (0.00 sec)
*/ORD()函数返回指定字符的数字编码,经常用于替代ASCII():
呃,我咋感觉其返回值与ASCII()一模一样。PHP也有这个函数,貌似 。
select ord('y'),ord('Simaopig'),ord('simaopig');
/*
+----------+-----------------+-----------------+
| ord('y') | ord('Simaopig') | ord('simaopig') |
+----------+-----------------+-----------------+
| 121 | 83 | 115 |
+----------+-----------------+-----------------+
1 row in set (0.00 sec)
*/
对于针对字符串位置的操作,第一个位置被标记为1。
ASCII(str)
返回字符串str的 最左面字符的ASCII代码值。如果str是空字符串, 返回0。如果str是NULL,返回NULL。
mysql> select ASCII('2'); -> 50mysql> select ASCII(2); -> 50mysql> select ASCII('dx'); -> 100
也可参见ORD()函数。
ORD(str)
如果字符串str最左面字符是一个多字节字符,通过以格式((first byte ASCII code)*256+(second byte ASCII code))[*256+third byte ASCII code...]返 回字符的ASCII代码值来返回多字节字符代码。如果最左面的字符不是一个多字节字符。返回与ASCII()函 数返回的相同值。
mysql> select ORD('2'); -> 50
CONV(N,from_base,to_base)
在不同的数字基之间变换数字。返回数字N的字符串数字, 从from_base基变换为to_base基,如果任何参数是NULL, 返回NULL。参数N解 释为一个整数,但是可以指定为一个整数或一个字符串。最小基是2且最大的基 是36。如果to_base是 一个负数,N被认为是一个有符号数,否则,N被当作无符号数。 CONV以 64位点精度工作。
mysql> select CONV("a",16,2); -> '1010'mysql> select CONV("6E",18,8); -> '172'mysql> select CONV(-17,10,-18); -> '-H'mysql> select CONV(10+"10"+'10'+0xa,10,10); -> '40'
BIN(N)
返回二进制值N的一个字符串表示,在此N是一个长整数(BIGINT) 数字,这等价于CONV(N,10,2)。如果N是NULL,返回NULL。
mysql> select BIN(12); -> '1100'
OCT(N)
返回八进制值N的一个字符串的表示,在此N是一个长整型数字,这等价于CONV(N,10,8)。 如果N是NULL,返回NULL。
mysql> select OCT(12); -> '14'
HEX(N)
返回十六进制值N一个字符串的表示,在此N是一个长整型(BIGINT) 数字,这等价于CONV(N,10,16)。如果N是NULL,返回NULL。
mysql> select HEX(255); -> 'FF'
CHAR(N,...)
CHAR()将参数解释为整数并且返回 由这些整数的ASCII代码字符组成的一个字符串。NULL值 被跳过。
mysql> select CHAR(77,121,83,81,'76'); -> 'MySQL'mysql> select CHAR(77,77.3,'77.3'); -> 'MMM'
CONCAT(str1,str2,...)
返回来自于参数连结的字符串。如果任何参数是NULL, 返回NULL。可以有超过2个的参数。一个数字参数被变换为等价的字符串形 式。
mysql> select CONCAT('My', 'S', 'QL'); -> 'MySQL'mysql> select CONCAT('My', NULL, 'QL'); -> NULLmysql> select CONCAT(14.3); -> '14.3'
LENGTH(str)
OCTET_LENGTH(str)
CHAR_LENGTH(str)
CHARACTER_LENGTH(str)
返回字符串str的长度。
mysql> select LENGTH('text'); -> 4mysql> select OCTET_LENGTH('text'); -> 4
注意,对于多字节字符,其CHAR_LENGTH()仅计算一次。
LOCATE(substr,str)
POSITION(substr IN str)
返回子串substr在字符串str第一个出现的位置,如果substr不 是在str里面,返回0.
mysql> select LOCATE('bar', 'foobarbar'); -> 4mysql> select LOCATE('xbar', 'foobar'); -> 0
该函数是多字节可靠的。
LOCATE(substr,str,pos)
返回子串substr在字符串str第一个出现的位置,从位置pos开 始。如果substr不是在str里 面,返回0。
mysql> select LOCATE('bar', 'foobarbar',5); -> 7
这函数是多字节可靠的。
INSTR(str,substr)
返回子串substr在字符串str中的第一个出现的位置。这与有2个参数形式的LOCATE()相 同,除了参数被颠倒。
mysql> select INSTR('foobarbar', 'bar'); -> 4mysql> select INSTR('xbar', 'foobar'); -> 0
这函数是多字节可靠的。
LPAD(str,len,padstr)
返回字符串str,左面用字符串padstr填补直到str是len个字符长。
mysql> select LPAD('hi',4,'??'); -> '??hi'
RPAD(str,len,padstr)
返回字符串str,右面用字符串padstr填补直到str是len个字符长。
mysql> select RPAD('hi',5,'?'); -> 'hi???'
LEFT(str,len)
返回字符串str的最左面len个字符。
mysql> select LEFT('foobarbar', 5); -> 'fooba'
该函数是多字节可靠的。
RIGHT(str,len)
返回字符串str的最右面len个字符。
mysql> select RIGHT('foobarbar', 4); -> 'rbar'
该函数是多字节可靠的。
SUBSTRING(str,pos,len)
SUBSTRING(str FROM pos FOR len)
MID(str,pos,len)
从字符串str返回一个len个字符的子串,从位置pos开 始。使用FROM的变种形式是ANSI SQL92语法。
mysql> select SUBSTRING('Quadratically',5,6); -> 'ratica'
该函数是多字节可靠的。
SUBSTRING(str,pos)
SUBSTRING(str FROM pos)
从字符串str的起始位置pos返回一个子串。
mysql> select SUBSTRING('Quadratically',5); -> 'ratically'mysql> select SUBSTRING('foobarbar' FROM 4); -> 'barbar'
该函数是多字节可靠的。
SUBSTRING_INDEX(str,delim,)
返回从字符串str的第count个出现的分 隔符delim之后的子串。如果count是正数,返回最后的分隔符到左边(从左边数) 的所有字符。如果count是负数,返回最后的分隔符到右边的所有字符(从右边数)。
mysql> select SUBSTRING_INDEX('www.mysql.com', '.', 2); -> 'www.mysql'mysql> select SUBSTRING_INDEX('www.mysql.com', '.', -2); -> 'mysql.com'
该函数对多字节是可靠的。
LTRIM(str)
返回删除了其前置空格字符的字符串str。
mysql> select LTRIM(' barbar'); -> 'barbar'
RTRIM(str)
返回删除了其拖后空格字符的字符串str。
mysql> select RTRIM('barbar '); -> 'barbar'
该函数对多字节是可靠的。
TRIM([[BOTH | LEADING | TRAILING] [remstr] FROM] str)
返回字符串str,其所有remstr前缀或后缀被删除了。如果没有修饰符BOTH、LEADING或TRAILING给 出,BOTH被假定。如果remstr没 被指定,空格被删除。
mysql> select TRIM(' bar '); -> 'bar'mysql> select TRIM(LEADING 'x' FROM 'xxxbarxxx'); -> 'barxxx'mysql> select TRIM(BOTH 'x' FROM 'xxxbarxxx'); -> 'bar'mysql> select TRIM(TRAILING 'xyz' FROM 'barxxyz'); -> 'barx'
该函数对多字节是可靠的。
SOUNDEX(str)
返回str的一个同音字符串。听起来“大致相同”的2个 字符串应该有相同的同音字符串。一个“标准”的同音字符串长是4个字符,但是SOUNDEX()函 数返回一个任意长的字符串。你可以在结果上使用SUBSTRING()得到 一个“标准”的 同音串。所有非数字字母字符在给定的字符串中被忽略。所有在A-Z之外的字符国际字母被当作元音。
mysql> select SOUNDEX('Hello'); -> 'H400'mysql> select SOUNDEX('Quadratically'); -> 'Q36324'
SPACE(N)
返回由N个空格字符组成的一个字符串。
mysql> select SPACE(6); -> ' '
REPLACE(str,from_str,to_str)
返回字符串str,其字符串from_str的所有出现由字符串to_str代 替。
mysql> select REPLACE('www.mysql.com', 'w', 'Ww'); -> 'WwWwWw.mysql.com'
该函数对多字节是可靠的。
REPEAT(str,count)
返回由重复countTimes次的字符串str组成的一个字符串。如果count
mysql> select REPEAT('MySQL', 3); -> 'MySQLMySQLMySQL'
REVERSE(str)
返回颠倒字符顺序的字符串str。
mysql> select REVERSE('abc'); -> 'cba'
该函数对多字节可靠的。
INSERT(str,pos,len,newstr)
返回字符串str,在位置pos起始的子串且len个 字符长得子串由字符串newstr代替。
mysql> select INSERT('Quadratic', 3, 4, 'What'); -> 'QuWhattic'
该函数对多字节是可靠的。
ELT(N,str1,str2,str3,...)
如果N= 1,返回str1,如 果N= 2, 返回str2,等等。如果N小 于1或大于参数个数,返回NULL。ELT()是FIELD()反 运算。
mysql> select ELT(1, 'ej', 'Heja', 'hej', 'foo'); -> 'ej'mysql> select ELT(4, 'ej', 'Heja', 'hej', 'foo'); -> 'foo'
FIELD(str,str1,str2,str3,...)
返回str在str1, str2, str3, ...清 单的索引。如果str没找到,返回0。FIELD()是ELT()反运算。
mysql> select FIELD('ej', 'Hej', 'ej', 'Heja', 'hej', 'foo'); -> 2mysql> select FIELD('fo', 'Hej', 'ej', 'Heja', 'hej', 'foo'); -> 0
FIND_IN_SET(str,strlist)
如果字符串str在由N子串组成的表strlist之 中,返回一个1到N的 值。一个字符串表是被“,”分隔的子串组成的一个字符串。如果第一个参数是 一个常数字符串并且第二个参数是一种类型为SET的列,FIND_IN_SET()函数被优化而使用位运算!如果str不是在strlist里 面或如果strlist是空字符串,返回0。如果任何一个参数是NULL, 返回NULL。如果第一个参数包含一个“,”,该函数将工作不正常。
mysql> SELECT FIND_IN_SET('b','a,b,c,d'); -> 2
MAKE_SET(bits,str1,str2,...)
返回一个集合 (包含由“,”字符分隔的子串组成的一个 字符串),由相应的位在bits集合中的的字符串组成。str1对应于位0,str2对 应位1,等等。在str1, str2, ...中 的NULL串不添加到结果中。
mysql> SELECT MAKE_SET(1,'a','b','c'); -> 'a'mysql> SELECT MAKE_SET(1 | 4,'hello','nice','world'); -> 'hello,world'mysql> SELECT MAKE_SET(0,'a','b','c'); -> ''
EXPORT_SET(bits,on,off,[separator,[number_of_bits]])
返回一个字符串,在这里对于在“bits”中设定每一位,你得到一个“on”字符串,并且对于每个复位(reset)的位,你得到一个 “off”字符串。每个字符串用“separator”分隔(缺省“,”),并且只有“bits”的“number_of_bits” (缺省64)位被使用。
mysql> select EXPORT_SET(5,'Y','N',',',4) -> Y,N,Y,N
LCASE(str)
LOWER(str)
返回字符串str,根据当前字符集映射(缺省是ISO- 8859-1 Latin1)把所有的字符改变成小写。该函数对多字节是可靠的。
mysql> select LCASE('QUADRATICALLY'); -> 'quadratically'
UCASE(str)
UPPER(str)
返回字符串str,根据当前字符集映射(缺省是ISO- 8859-1 Latin1)把所有的字符改变成大写。该函数对多字节是可靠的。
mysql> select UCASE('Hej'); -> 'HEJ'
该函数对多字节是可靠的。
LOAD_FILE(file_name)
读入文件并且作为一个字符串返回文件内容。文件必须在服务器上,你必须指定到文件的完整路径名,而且你必须有file权 限。文件必须所有内容都是可读的并且小于max_allowed_packet。 如果文件不存在或由于上面原因之一不能被读出,函数返回NULL。
mysql> UPDATE table_name SET blob_column=LOAD_FILE("/tmp/picture") WHERE id=1;
MySQL必要时自动变换数字为字符串,并且反过来也如此:
mysql> SELECT 1+"1"; -> 2mysql> SELECT CONCAT(2,' test'); -> '2 test'
如果你想要明确地变换一个数字到一个字符串,把它作为参数传递到CONCAT()。
如果字符串函数提供一个二进制字符串作为参数,结果字符串也是一个二进制字符串。被变换到一个字符串的数字被当作是一个二进制字符串。这仅影响比 较。