首頁  >  文章  >  web前端  >  JavaScript字串常見基礎方法精講

JavaScript字串常見基礎方法精講

WBOY
WBOY轉載
2022-05-25 11:59:052726瀏覽

本篇文章為大家帶來了關於javascript的相關知識,其中主要介紹了關於字串的相關知識,其中主要介紹了常用的基礎方法以及特殊字元、JavaScript字串常見基礎方法精講內部表示方式等內容,下面一起來看一下,希望對大家有幫助。

JavaScript字串常見基礎方法精講

【相關推薦:javascript影片教學web前端

不論在何種程式語言中,字串都是重要的資料類型,跟隨我了解更多JavaScript字串知識吧!

前言

字串就是由字元組成的字串,如果學習過CJava就應該知道,字元本身也可以獨立成為一個類型。但是,JavaScript沒有單一的字元類型,只有長度為1的字串。

JavaScript的字串採用固定的UTF-16編碼,不論我們寫程式時採用何種編碼,都不會影響。

寫法

字串有三種寫法:單引號、雙引號、反引號。

let single = 'abcdefg';//单引号let double = "asdfghj";//双引号let backti = `zxcvbnm`;//反引号

單、雙引號具有相同的地位,我們不做區分。

字串格式化

反引號允許我們使用${...}優雅的格式化字串,取代使用字串加運算。

let str = `I'm ${Math.round(18.5)} years old.`;console.log(str);

程式碼執行結果:

JavaScript字串常見基礎方法精講

#多行字串

反引號也可以允許字串跨行,當我們編寫多行字串的時候非常有用。

let ques = `Is the author handsome?
A. Very handsome;
B. So handsome;
C. Super handsome;`;console.log(ques);

程式碼執行結果:

JavaScript字串常見基礎方法精講

是不是看起來覺得也沒有什麼?但是使用單雙引號是不能實現的,如果想要得到同樣的結果可以這麼寫:

let ques = 'Is the author handsome?\nA. Very handsome;\nB. So handsome;\nC. Super handsome;';console.log(ques);

以上程式碼包含了一個特殊字元\n,它是我們程式設計過程中最常見的特殊字符了。

特殊字元

字元\n又稱為"換行符號",支援單雙引號輸出多行字串。當引擎輸出字串時,若遇到\n,就會另換一行繼續輸出,從而實現多行字串。

雖然\n看起來是兩個字符,但是只佔用一個字符位置,這是因為\在字串中是轉義符,被轉義符修飾的字元就變成了特殊字元。

特殊字元清單

##\n換行符,用於新起一行輸出文字。 \r\n就可以了。 \"#單雙引號,主要是因為單雙引號是特殊字符,我們想在字串中使用單雙字元就要轉義。\\\本身,就要對其轉義。\v退格、換頁、垂直標籤-已經不再使用。)。
特殊字元 描述
回車符,將遊標移到行首,在Windows系統中使用\r\n表示一個換行,意思是遊標需要先到行首,然後到下一行才可以換一個新的行。其他系統直接使用
\'
反斜線,同樣因為\是特殊字符,如果我們就是想輸出
\b\ f
##\xXX 編碼為XX的十六進位Unicode字符,例如:\x7A表示zz的十六進位Unicode編碼為7A
##\uXXXX 編碼為XXXX的十六進位Unicode字符,例如:\u00A9表示© 。
\u{X...X}1-6個十六進位字元) UTF-32編碼為X...XUnicode符號。

举个例子:

console.log('I\'m a student.');// \'console.log("\"I love U\"");// \"console.log("\\n is new line character.");// \nconsole.log('\u00A9')// ©console.log('\u{1F60D}');//

代码执行结果:

JavaScript字串常見基礎方法精講

有了转义符\的存在,理论上我们可以输出任何字符,只要找到它对应的编码就可以了。

避免使用\'\"

对于字符串中的单双引号,我们可以通过在单引号中使用双引号、在双引号中使用单引号,或者直接在反引号中使用单双引号,就可以巧妙的避免使用转义符,例如:

console.log("I'm a student.");
//双引号中使用单引号console.log('"" is used.');
//单引号中使用双引号console.log(`' " is used.`);
//反引号中使用单双引号

代码执行结果如下:

JavaScript字串常見基礎方法精講

.length

通过字符串的.length属性,我们可以获得字符串的长度:

console.log("HelloWorld\n".length);//11

这里\n只占用了一个字符。

《基础类型的方法》章节我们探究了JavaScript中的基础类型为什么会有属性和方法,你还记得吗?

访问字符、charAt()、for…of

字符串是字符组成的串,我们可以通过[字符下标]访问单个的字符,字符下标从0开始:

let str = "The author is handsome.";
console.log(str[0]);//Tconsole.log(str[4]);//aconsole.log(str[str.length-1]);//.

代码执行结果:

JavaScript字串常見基礎方法精講

我们还可以使用charAt(post)函数获得字符:

let str = "The author is handsome.";console.log(str.charAt(0));
//Tconsole.log(str.charAt(4));
//aconsole.log(str.charAt(str.length-1));//.

二者执行效果完全相同,唯一的区别在于越界访问字符时:

let str = "01234";console.log(str[9]);//undefinedconsole.log(str.charAt(9));//""(空串)

我们还可以使用for ..of遍历字符串:

for(let c of '01234'){
    console.log(c);}

字符串不可变

JavaScript中的字符串一经定义就不可更改,举个例子:

let str = "Const";str[0] = 'c' ;console.log(str);

代码执行结果:

JavaScript字串常見基礎方法精講

如果想获得一个不一样的字符串,只能新建:

let str = "Const";str = str.replace('C','c');console.log(str);

看起来我们似乎改变了字符串,实际上原来的字符串并没有被改变,我们得到的是replace方法返回的新字符串。

.toLowerCase()、.toUpperCase()

转换字符串大小写,或者转换字符串中单个字符的大小写。

这两个字符串的方法比较简单,举例带过:

console.log('Good Boy'.toLowerCase());//good 
boyconsole.log('Good Boy'.toUpperCase());//GOOD 
BOYconsole.log('Good Boy'[5].toLowerCase());//b

代码执行结果:

JavaScript字串常見基礎方法精講

.indexOf()、.lastIndexOf() 查找子串

.indexOf(substr,idx)函数从字符串的idx位置开始,查找子串substr的位置,成功返回子串首字符下标,失败返回-1

let str = "google google";console.log(str.indexOf('google'));
//0 idx默认为0console.log(str.indexOf('google',1));
//7 从第二个字符开始查找console.log(str.indexOf('xxx'));
//-1 没找到返回-1

代码执行结果:

JavaScript字串常見基礎方法精講

如果我们想查询字符串中所有子串位置,可以使用循环:

let str = "I love love love love u.";let sub = "love";let pos = -1;while((pos = str.indexOf(sub,pos+1)) != -1)
    console.log(pos);

代码执行结果如下:

JavaScript字串常見基礎方法精講

.lastIndexOf(substr,idx)倒着查询子串,首先查找最后一个符合的串:

let str = "google google";console.log(str.lastIndexOf('google'));//7 idx默认为0

按位取反技巧(不推荐,但要会)

由于indexOf()lastIndexOf()方法在查询不成功的时候会返回-1,而~-1 === 0。也就是说只有在查询结果不为-1的情况下使用~才为真,所以我们可以:

let str = "google google";if(~indexOf('google',str)){
    ...}

通常情况下,我们不推荐在不能明显体现语法特性的地方使用一个语法,这会在可读性上产生影响。好在以上代码只出现在旧版本的代码中,这里提到就是为了大家在阅读旧代码的时候不会产生困惑。

补充:

~是按位取反运算符,例如:十进制的数字2的二进制形式为0010~2的二进制形式就是1101(补码),也就是-3

简单的理解方式,~n等价于-(n+1),例如:~2 === -(2+1) === -3

.includes()、.startsWith()、.endsWith()

  1. .includes(substr,idx)用于判断substr是否在字符串中,idx是查询开始的位置

    console.log('Google Google'.includes('Google'));//trueconsole.log('Google Google'.includes('xxxxxx'));//falseconsole.log('9966'.includes('99',1));//false

    代码执行结果:

    JavaScript字串常見基礎方法精講

  2. .startsWith('substr').endsWith('substr')分别判断字符串是否以substr开始或结束

    console.log("google".startsWith('go'));//trueconsole.log('google'.endsWith('le'));//trueconsole.log('google'.endsWith('ie'));//false

    代码执行结果:

    JavaScript字串常見基礎方法精講

.JavaScript字串常見基礎方法精講、.JavaScript字串常見基礎方法精講、.JavaScript字串常見基礎方法精講

.JavaScript字串常見基礎方法精講.JavaScript字串常見基礎方法精講.JavaScript字串常見基礎方法精講均用于取字符串的子串,不过用法各有不同。

  1. .substr(start,len)

    返回字符串从start开始len个字符组成的字符串,如果省略len,就截取到原字符串的末尾。start可以为负数,表示从后往前第start个字符。

    let str = "0123456789";console.log(str.substr(1))//123456789,从1开始到最后console.log(str.substr(3,2))//34,从3开始的2个字符console.log(str.substr(-3,2))//78,倒数第二个开始

    代码执行结果:

    JavaScript字串常見基礎方法精講

  2. .slice(start,end)

    返回字符串从start开始到end结束(不包括)的字符串。startend可以为负数,表示倒数第start/end个字符。

    let str = '0123456789';console.log(str.slice(1,5));//1234,区间[1,5)之间的字符console.log(str.slice(1));//123456789,从1到结尾console.log(str.slice(-4,-1));//678,倒数第四个到倒数第1个

    代码执行结果:

    JavaScript字串常見基礎方法精講

  3. .substring(start,end)

    作用几乎和.JavaScript字串常見基礎方法精講相同,差别在两个地方:

    • 允许end > start;
    • 不允许负数,负数视为0;

    举例:

    let str = '0123456789';console.log(str.substring(1,3));//12console.log(str.substring(3,1));//12console.log(str.substring(-1,3));//012,-1被当作0

    代码执行结果:

    JavaScript字串常見基礎方法精講

对比三者的区别:

方法 描述 参数
.slice(start,end) [start,end) 可负
.substring(start,end) [start,end) 负值为0
.substr(start,len) start开始长为len的子串 可负

方法多了自然就选择困难了,这里建议记住.JavaScript字串常見基礎方法精講就可以了,相比于其他两种更灵活。

.JavaScript字串常見基礎方法精講、JavaScript字串常見基礎方法精講

我们在前文中已经提及过字符串的比较,字符串按照字典序进行排序,每个字符背后都是一个编码,ASCII编码就是一个重要的参考。

例如:

console.log('a'>'Z');//true

字符之间的比较,本质上是代表字符的编码之间的比较。JavaScript使用UTF-16编码字符串,每个字符都是一个16为的代码,想要知道比较的本质,就需要使用.codePointAt(idx)获得字符的编码:

console.log('a'.codePointAt(0));//97console.log('Z'.codePointAt(0));//90

代码执行结果:

JavaScript字串常見基礎方法精講

使用String.fromCodePoint(code)可以把编码转为字符:

console.log(String.fromCodePoint(97));console.log(String.fromCodePoint(90));

代码执行结果如下:

JavaScript字串常見基礎方法精講

这个过程可以用转义符\u实现,如下:

console.log('\u005a');//Z,005a是90的16进制写法console.log('\u0061');//a,0061是97的16进制写法

下面我们探索一下编码为[65,220]区间的字符:

let str = '';for(let i = 65; i<p>代码执行部分结果如下:</p><p><img src="https://img.php.cn/upload/article/000/000/067/0f4e2a78ef52090d845bd32f6b72d01c-17.png" alt="JavaScript字串常見基礎方法精講"></p><p>上图并没有展示所有的结果,快去试试吧。</p><h2>.localeCompare()</h2><p>基于国际化标准<code>ECMA-402</code>,<code>JavaScript</code>已经实现了一个特殊的方法(<code>.localeCompare()</code>)比较各种字符串,采用<code>str1.localeCompare(str2)</code>的方式:</p><ol>
<li>如果<code>str1 ,返回负数;</code>
</li>
<li>如果<code>str1 > str2</code>,返回正数;</li>
<li>如果<code>str1 == str2</code>,返回0;</li>
</ol><p>举个例子:</p><pre class="brush:php;toolbar:false">console.log("abc".localeCompare('def'));//-1

为什么不直接使用比较运算符呢?

这是因为英文字符有一些特殊的写法,例如,áa的变体:

console.log('á' <p>虽然也是<code>a</code>,但是比<code>z</code>还要大!!</p><p>此时就需要使用<code>.localeCompare()</code>方法:</p><pre class="brush:php;toolbar:false">console.log('á'.localeCompare('z'));//-1

常用方法

  1. str.trim()去除字符串前后空白字符,str.trimStart()str.trimEnd()删除开头、结尾的空格;

    let str = "  999   ";console.log(str.trim());//999
  2. str.repeat(n)重复n次字符串;

    let str = '6';console.log(str.repeat(3));//666
  3. str.replace(substr,newstr)替换第一个子串,str.replaceAll()用于替换所有子串;

    let str = '9+9';console.log(str.replace('9','6'));//6+9console.log(str.replaceAll('9','6'));//6+6

还有很多其他方法,我们可以访问手册获取更多知识。

进阶内容

生僻字、JavaScript字串常見基礎方法精講、特殊符号

JavaScript使用UTF-16编码字符串,也就是使用两个字节(16位)表示一个字符,但是16位数据只能表示65536个字符,对于常见字符自然不在话下,但是对于生僻字(中文的)、JavaScript字串常見基礎方法精講、罕见数学符号等就力不从心了。

这种时候就需要扩展,使用更长的位数(32位)表示特殊字符,例如:

console.log(''.length);//2console.log('?'.length);//2

代码执行结果:

JavaScript字串常見基礎方法精講

这么做的结果是,我们无法使用常规的方法处理它们,如果我们单个输出其中的每个字节,会发生什么呢?

console.log(''[0]);console.log(''[1]);

代码执行结果:

JavaScript字串常見基礎方法精講

可以看到,单个输出字节是不能识别的。

好在JavaScript字串常見基礎方法精講.JavaScript字串常見基礎方法精講两个方法是可以处理这种情况的,这是因为二者是最近才加入的。在旧版本的JavaScript中,只能使用String.fromCharCode().charCodeAt()两个方法转换编码和字符,但是他们不适用于特殊字符的情况。

我们可以通过判断一个字符的编码范围,判断它是否是一个特殊字符,从而处理特殊字符。如果一个字符的代码在0xd800~0xdbff之间,那么他是32位字符的第一部分,它的第二部分应该在0xdc00~0xdfff

举个例子:

console.log(''.charCodeAt(0).toString(16));//d83
dconsole.log('?'.charCodeAt(1).toString(16));//de02

代码执行结果:

JavaScript字串常見基礎方法精講

规范化

在英文中,存在很多基于字母的变体,例如:字母 a 可以是 àáâäãåā 的基本字符。这些变体符号并没有全部存储在UTF-16编码中,因为变化组合太多了。

为了支持所有的变体组合,同样使用多个Unicode字符表示单个变体字符,在编程过程中,我们可以使用基本字符加上“装饰符号”的方式表达特殊字符:

console.log('a\u0307');//ȧ
console.log('a\u0308');//ȧ
console.log('a\u0309');//ȧ
console.log('E\u0307');//Ė
console.log('E\u0308');//Ë
console.log('E\u0309');//Ẻ

代码执行结果:

JavaScript字串常見基礎方法精講

一个基础字母还可以有多个装饰,例如:

console.log('E\u0307\u0323');//Ẹ̇
console.log('E\u0323\u0307');//Ẹ̇

代码执行结果:

JavaScript字串常見基礎方法精講

这里存在一个问题,在多个装饰的情况下,装饰的排序不同,实际上展示的字符是一样的。

如果我们直接比较这两种表示形式,却会得到错误的结果:

let e1 = 'E\u0307\u0323';
let e2 = 'E\u0323\u0307';
console.log(`${e1}==${e2} is ${e1 == e2}`)

代码执行结果:

JavaScript字串常見基礎方法精講

为了解决这种情况,有一个**Unicode规范化算法,可以将字符串转为通用**格式,由str.normalize()实现:

<span   style="max-width:90%" microsoft yahei sans gb helvetica neue tahoma arial sans-serif>let e1 = 'E\u0307\u0323';<br>let e2 = 'E\u0323\u0307';<br>console.log(`${e1}==${e2} is ${e1.normalize() == e2.normalize()}`)</span><br>

代码执行结果:

JavaScript字串常見基礎方法精講

【相关推荐:javascript视频教程web前端

以上是JavaScript字串常見基礎方法精講的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:csdn.net。如有侵權,請聯絡admin@php.cn刪除