JavaScript中的正则表达式简明总结

日期：2020-06-11 栏目：程序人生浏览：次

一、定义正则表达式的方法

定义正则表达式的方法有两种：构造函数定义和正则表达式直接量定义。例如：

var reg1 = new RegExp('\d{5, 11}'); // 通过构造函数定义
var reg2 = /\d{5, 12}/; // 通过直接量定义

正则表达式直接量字符
       \o：NUL字符（\u0000）
       \t：制表符（\u0009）
       \n：换行符（\u000A）
       \v：垂直制表符（\u000B）
       \f：换页符（\u000C）
       \r：回车符（\u000D）
       \xnn：由十六进制数nn指定的拉丁字符，例如，\x0A等价于\n
       \uxxxx：由十六进制数xxxx指定的Unicode字符，例如\u0009等价于\t
       \cX：控制字符^X，例如，\cJ等价于换行符\n
正则表达式锚字符
       ^：匹配字符串的开头，在多行检索中，匹配一行的开头
       $：匹配字符串的结尾，在多行检索中，匹配一行的结尾
       \b：匹配一个单词的边界，简言之，就是位于字符\w和\W之间的位置，或位于字符\w和字符串的开头或者结尾之间的位置（[\b]匹配的是退格符）
       \B：匹配非单词边界的位置
       (?=p)：零宽正向先行断言，要求接下来的字符都与p匹配，但不能包括匹配p的那些字符
       (？!p)：零宽负向先行断言，要求接下来的字符串不与p匹配
正则表达式的字符类
       [...]：方括号内的任意字符
       [^...]：不在方括号内的任意字符
       .：除换行符和其他Unicode行终止符之外的任意字符
       \w：任何ASCII字符组成的单词，等价于[a-zA-Z0-9]
       \W：任何不是ASCII字符组成的单词，等价于[^a-zA-Z0-9]
       \s：任何Unicode空白符
       \S：任何非Unicode空白符的字符，注意\w和\S不同
       \d：任何ASCII数字，等价于[0-9]
       \D：除了ASCII数字之外的任何字符，等价于[^0-9]
       [\b]：退格直接量（特例）
正则表达式的重复字符语法
       {n, m}：匹配前一项至少n次，但不能超过m次
       {n, }：匹配前一项n次或者更多次
       {n}：匹配前一项n次
       ?：匹配前一项0次或者1次，也就是说前一项是可选的，等价于{0, 1}
       +：匹配前一项1次或多次，等价于{1, }
       *：匹配前一项0次或多次，等价于{0, }
正则表达式的选择、分组和引用字符
       |：选择，匹配的是该符号左边的子表达式或右边的子表达式
       (…)：组合，将几个项组合为一个单元，这个单元可通过“*”、“+”、“?”和“|”等符号加以修饰，而且可以记住和这个组相匹配的字符串以供此后的任何使用
       (?: …)：只组合，把项组合到一个单元，但是不记忆与改组相匹配的字符
       \n：和第n个分组第一次匹配的字符相匹配，组是圆括号中的子表达式（也有可能是嵌套的），组索引是从左到右的左括号数，“(?:”形式的分组不编码
正则表达式修饰符
       i：执行不区分大小写的匹配
       g：执行一个全局匹配，简言之，即找到所有的匹配，而不是在找到第一个之后就停止
       m：多行匹配模式，^匹配一行的开头和字符串的开头，$匹配行的结尾和字符串的结尾
用于模式匹配的String方法
       search()：它的参数是一个正则表达式，返回第一个与之匹配的子串的起始位置，如果没有匹配的子串就返回-1。如果search()的参数不是正则表达式，则首先会通过RegExp构造函数将它转换为正则表达式，search()不支持全局检索，因为它忽略修饰符g。如：

复制代码代码如下:

var s = "JavaScript".search(/script/i); // s = 4

转载注明出处：https://www.heiqu.com/wdywjw.html

JavaScript中的正则表达式简明总结

相关推荐