正则表达式的直接量字符
字符 匹配
字母数字字符 本身
\o NUL字符(\u0000)
\t 制位表(\u0009)
\n 换行符(\u000A)
\v 垂直制位表(\u000B)
\f 换页符(\u000C)
\r 回车(\u000D)
\xnn 由十六进制数nn指定的拉丁字符,例如\u0A等价于\n
\uxxxx 由十六进制数xxxx指定的Unicode字符,例如\u0009等价于\t
\cX 控制字符X,例如,\cJ等价于\n
正则表达式的字符类
字符 匹配
[...] 位于括号内的任意字符
[^...] 不在括号之中的任意字符
. 除换行符和其他Unicode行中止符之外的任意字符
\w 任何ASCII单字字符,等价于[a-zA-Z0-9_]
\W 任何ASCII非单字字符,等价于[^a-zA-Z0-9_]
\s 任何Unicode空白符[\f\n\r\t\v]
\S 任何Unicode非空白符,注意\w和\S的不同[^\f\n\r\t\v]
\d 任何ASCII数字,等价于[0-9]
\D 除了ASCII数字之外的任何字符,等价于[^0-9]
[\b] 退格直接量(特例)
正则表达式的重复字符
字符 含义
{n,m} 匹配前一项至少n次,但不能超过m次
{n,} 匹配前一项n次,或更多次
{n} 匹配前一项恰好n次
? 匹配前一项0次或1次,也就是说这一项是可选的。等价于{0,1}
+ 匹配前一项1次或多次。等价于{1,}
* 匹配前一项0次或多次。等价于{0,}
在正则表达式中,括号具有几种作用。一个作用是把单独的项目组合成子表达式,以便可以象处理一个
独立的单元那样用|、*、+或?等来处理它们。括号的另一个作用是在完整的模式中定义子模式。当一
个正则表达式成功地和目标字符串相匹配时,可以从目标串中抽出和括号中的子模式相匹配的部分。
正则表达式的选择、分组和引用字符
字符 含义
| 选择。匹配的是该符号的左边的子表达式或右边的子表达式
(...) 组合。将几个项目组合为一个单元,这个单元可由|、*、+或?等符号使用,
而且还可以记住和这个组合匹配的字符,以供此后的引用使用
(?:...) 只组合。把项目组合到一个单元,但是不记忆与该组匹配的字符
\n 和第n个分组第一次匹配的字符相匹配,组是括号中的子表达式(可能是嵌套
的)。组号是从左到右计数的左括号数,以(?:形式分组的组不编码。
正则表达式的锚元素
字符 含义
^ 匹配字符串的开头,在多行检索中,匹配一行的开头
$ 匹配字符串的结尾,在多行检索中,匹配一行的结尾
\b 匹配一个词语的边界。简而言之,就是位于字符\w和\W之间的位置,或位于字符\w
和字符串的开头和结尾的位置(但注意:[\b]匹配的是退格符)
\B 匹配非词语边界的字符
(?=p) 正前向声明,要求接下来的字符都与模式p匹配,但是不包括匹配中的那些字符
(?!p) 反向前声明,要求接下来的字符不与模式P匹配
正则表达式的标志
字符 含义
i 执行大小写不敏感匹配
g 执行一个全局匹配,简而言之,即找到所有匹配,而不是找到第一个之后就停止
m 多行模式,^匹配一行的开头和字符串的开头,$匹配一行的结尾和字符串的结尾
JS中的RegExp对象
构造函数:显式构造函数,语法为:new RegExp("pattern"[,"flags"])。
隐式构造函数,语法为: /pattern/[flags]。
input 返回当前所作用的字符串,可以简写为$_,初始值为空字符串""。
lastIndex 是当前表达式模式首次匹配内容中最后一个字符的下一个位置,从0开始计数,常被作为继续搜索时的起始位置,初始值为-1,表示从起始位置开始搜索,每次成功匹配时,lastIndex属性值都会随之改变。
lastMatch 是当前表达式模式的最后一个匹配字符串,可以简写为$&。其初始值为空字符串""。在每次成功匹配时,lastMatch属性值都会随之改变。
lastParen 如果表达式模式中有括起来的子匹配,是当前表达式模式中最后的子匹配所匹配到的子字符串,可以简写为$+。其初始值为空字符串""。每次成功匹配时,lastParen属性值都会随之改变。
leftContext 是当前表达式模式最后一个匹配字符串左边的所有内容,可以简写为$`(其中“'”为键盘上“Esc”下边的反单引号)。初始值为空字符串""。每次成功匹配时,其属性值都会随之改变。
$1…$9 这些属性是只读的。如果表达式模式中有括起来的子匹配,$1…$9属性值分别是第1个到第9个子匹配所捕获到的内容。如果有超过9个以上的子匹配,$1…$9属性分别对应最后的9个子匹配。在一个表达式模式中,可以指定任意多个带括号的子匹配,但RegExp对象只能存储最后的9个子匹配的结果。在RegExp实例对象的一些方法所返回的结果数组中,可以获得所有圆括号内的子匹配结果。
实例属性 global 返回创建RegExp对象实例时指定的global标志(g)的状态。如果创建RegExp对象实例时设置了g标志,该属性返回True,否则返回False,默认值为False。
ignoreCase 返回创建RegExp对象实例时指定的ignoreCase标志(i)的状态。如果创建RegExp对象实例时设置了i标志,该属性返回True,否则返回False,默认值为False。
multiLine 返回创建RegExp对象实例时指定的multiLine标志(m)的状态。如果创建RegExp对象实例时设置了m标志,该属性返回True,否则返回False,默认值为False。
source 返回创建RegExp对象实例时指定的表达式文本字符串。
实例方法 exec 语法格式为exec(str)。该方法使用创建RegExp对象实例时所指定的表达式模式对一个字符串进行搜索,并返回一个包含搜索结果的数组。
如果为正则表达式设置了全局标志(g),可以通过多次调用exec和test方法在字符串中进行连续搜索,每次都是从RegExp对象的lastIndex属性值指定的位置开始搜索字符串。
如果没有设置全局标志(g),则exec和test方法忽略RegExp对象的lastIndex属性值,从字符串的起始位置开始搜索。如果exec方法没有找到匹配,返回值为null;如果找到匹配,则返回一个数组,并更新RegExp对象中有关静态属性以反映匹配情况。返回数组中的元素0包含了完整的匹配结果,而元素1~n依次是表达式模式中定义的各个子匹配的结果。
test 语法格式为test(str)。该方法检查一个字符串中是否存在创建RegExp对象实例时所指定的表达式模式,如果存在就返回True,否则返回False。 如果找到匹配项,则会更新RegExp对象中的有关静态属性,以反映匹配情况。
compile 语法格式为compile("pattern"[,"flags"])。该方法可以更换RegExp对象实例所使用的表达式模式,并将新的表达式模式编译为内部格式,从而使以后的匹配过程执行更快。
RegExp说明