浅谈JS正则表达式的RegExp对象和括号的使用

RegExp对象的创建:

常规的正则表达式的创建可用直接量,即斜杠 “/” 括起来的字符。但在要求参数变化的环境下,RegExp()构造函数是更好的选择:

var reg1 = /'\w+'/g;
var reg2 = new RegExp('\'\\w+\'','g');

对比两种创建方式,RegExp中的第一个参数为要创建的正则字符串,一方面注意,因为不是直接量的表示形式,因此不用斜杠“ / ”括起来了;而是字符串中必须要对引号“ ‘ ”和转义符号“ \ ”进行二次转义。

此外,无论是直接量还是RegExp()构造函数,都是生成了新的RegExp对象,并将其赋值给变量。

match()与exec()的异同:

match和exec是正则表达式匹配字符串的常用方法。两者实现的功能差不多,有些细微的区别:

1、使用方式

match是字符串包装对象的方法,用法:String.match(RegExp);

exec是正则表达式对象的方法,用法:RegExp.exec(String);

2、返回的结果

当RegExp没有设置全局标志 "g" 时:

两者的返回结果相同。即无匹配值时返回null,有匹配值时返回一个数组(令array)。array[0]为匹配的字符串,array[1]、array[2]……则对应为正则表达式中圆括号匹配的子字符串$1、$2……。同时数组带有两个属性,array.index表示匹配字符串的初始位置,array.input表示正在检索的字符串。

当RegExp有设置全局标志 "g" 时:

match在有值时返回一个数组array。数组的每项依次表示匹配到的所有的字符串,因此不再有圆括号匹配的子字符串了。此时数组没有index属性和input属性。

exec则与没有全局标示 "g" 的表现无异。此时返回的是数组array,array[0]为当前匹配的字符串,array[1],array[2]……则为当前匹配下的圆括号匹配的字串。此时要注意RegExp对象的lastIndex属性,表示原字符串中匹配的字符串末尾的后一个位置。当没有进一步的匹配结果时,lastIndex属性置0。因此,可用lastIndex的循环找出所有的匹配字符串。

支持多次匹配的方式:

js 代码

var testStr = "now test001 test002"; var re = /test(\d+)/ig; var r = ""; while(r = re.exec(testStr)) { alert(r[0] + " " + r[1]); }

此外也可以用testStr.match(re),但是这样的话就不能有g的选项,而且只能得到第一个匹配。

1. 正则表达式规则

1.1 普通字符

字母、数字、汉字、下划线、以及后边章节中没有特殊定义的标点符号,都是"普通字符"。表达式中的普通字符,在匹配一个字符串的时候,匹配与之相同的一个字符。

举例1:表达式 "c",在匹配字符串 "abcde" 时,匹配结果是:成功;匹配到的内容是:"c";匹配到的位置是:开始于2,结束于3。(注:下标从0开始还是从1开始,因当前编程语言的不同而可能不同)

举例2:表达式 "bcd",在匹配字符串 "abcde" 时,匹配结果是:成功;匹配到的内容是:"bcd";匹配到的位置是:开始于1,结束于4。

1.2 简单的转义字符

一些不便书写的字符,采用在前面加 "https://www.jb51.net/" 的方法。这些字符其实我们都已经熟知了。

表达式

 

可匹配

 

/r, /n

 

代表回车和换行符

 

/t

 

制表符

 

//

 

代表 "https://www.jb51.net/" 本身

 

还有其他一些在后边章节中有特殊用处的标点符号,在前面加 "https://www.jb51.net/" 后,就代表该符号本身。比如:^, $ 都有特殊意义,如果要想匹配字符串中 "^" 和 "$" 字符,则表达式就需要写成 "/^" 和 "/$"。

表达式

 

可匹配

 

/^

 

匹配 ^ 符号本身

 

/$

 

匹配 $ 符号本身

 

/.

 

匹配小数点(.)本身

 

这些转义字符的匹配方法与 "普通字符" 是类似的。也是匹配与之相同的一个字符。

举例1:表达式 "/$d",在匹配字符串 "abc$de" 时,匹配结果是:成功;匹配到的内容是:"$d";匹配到的位置是:开始于3,结束于5。

1.3 能够与 '多种字符' 匹配的表达式

正则表达式中的一些表示方法,可以匹配 '多种字符' 其中的任意一个字符。比如,表达式 "/d" 可以匹配任意一个数字。虽然可以匹配其中任意字符,但是只能是一个,不是多个。这就好比玩扑克牌时候,大小王可以代替任意一张牌,但是只能代替一张牌。

表达式

 

可匹配

 

/d

 

任意一个数字,0~9 中的任意一个

 

/w

 

任意一个字母或数字或下划线,也就是 A~Z,a~z,0~9,_ 中任意一个

 

/s

 

包括空格、制表符、换页符等空白字符的其中任意一个

 

.

 

小数点可以匹配除了换行符(/n)以外的任意一个字符

 

举例1:表达式 "/d/d",在匹配 "abc123" 时,匹配的结果是:成功;匹配到的内容是:"12";匹配到的位置是:开始于3,结束于5。

举例2:表达式 "a./d",在匹配 "aaa100" 时,匹配的结果是:成功;匹配到的内容是:"aa1";匹配到的位置是:开始于1,结束于4。

1.4 自定义能够匹配 '多种字符' 的表达式

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/wzxpww.html