深入浅析JavaScript中的RegExp对象(5)

日期：2020-06-07 栏目：程序人生浏览：次

另外，不要过分使用连字符，设定一个很大的范围，否则很可能选中意料之外的字符。最典型的例子就是[A-z]，表面上它是选中从大写的A到小写的z之间52个字母，但是由于在ASCII编码之中，大写字母与小写字母之间还有其他字符，结果就会出现意料之外的结果。

/[A-z]/.test('\\') // true

上面代码中，由于反斜杠（\\）的ASCII码在大写字母与小写字母之间，结果会被选中。

预定义模式

预定义模式指的是某些常见模式的简写方式。

\d 匹配0-9之间的任一数字，相当于[0-9]。

\D 匹配所有0-9以外的字符，相当于[^0-9]。

\w 匹配任意的字母、数字和下划线，相当于[A-Za-z0-9_]。

\W 除所有字母、数字和下划线以外的字符，相当于[^A-Za-z0-9_]。

\s 匹配空格（包括制表符、空格符、断行符等），相等于[\t\r\n\v\f]。

\S 匹配非空格的字符，相当于[^\t\r\n\v\f]。

\b 匹配词的边界。

\B 匹配非词边界，即在词的内部。

下面是一些例子。

// \s的例子 /\s\w*/.exec('hello world') // [" world"] // \b的例子 /\bworld/.test('hello world') // true /\bworld/.test('hello-world') // true /\bworld/.test('helloworld') // false // \B的例子 /\Bworld/.test('hello-world') // false /\Bworld/.test('helloworld') // true

上面代码中，\s表示空格，所以匹配结果会包括空格。\b表示词的边界，所以“world”的词首必须独立（词尾是否独立未指定），才会匹配。同理，\B表示非词的边界，只有“world”的词首不独立，才会匹配。

通常，正则表达式遇到换行符（\n）就会停止匹配。

var html = "Hello\nworld!"; /.*/.exec(html)[0] // "Hello"

上面代码中，字符串html包含一个换行符，结果点字符（.）不匹配换行符，导致匹配结果可能不符合原意。这时使用\s字符类，就能包括换行符。

var html = "Hello\nworld!"; /[\S\s]*/.exec(html)[0] // "Hello\nworld!" // 另一种写法（用到了非捕获组） /(?:.|\s)*/.exec(html)[0] // "Hello\nworld!"

上面代码中，[\S\s]指代一切字符。

重复类

模式的精确匹配次数，使用大括号（{}）表示。{n}表示恰好重复n次，{n,}表示至少重复n次，{n,m}表示重复不少于n次，不多于m次。

/lo{2}k/.test('look') // true /lo{2,5}k/.test('looook') // true

上面代码中，第一个模式指定o连续出现2次，第二个模式指定o连续出现2次到5次之间。

量词符

量词符用来设定某个模式出现的次数。

? 问号表示某个模式出现0次或1次，等同于{0, 1}。

* 星号表示某个模式出现0次或多次，等同于{0,}。

+ 加号表示某个模式出现1次或多次，等同于{1,}。

// t出现0次或1次 /t?est/.test('test') // true /t?est/.test('est') // true // t出现1次或多次 /t+est/.test('test") // true /t+est/.test('ttest') // true /t+est/.test('est') // false // t出现0次或多次 /t*est/.test('test') // true /t*est/.test('ttest') // true /t*est/.test('tttest') // true /t*est/.test('est') // true

贪婪模式

上一小节的三个量词符，默认情况下都是最大可能匹配，即匹配直到下一个字符不满足匹配规则为止。这被称为贪婪模式。

var s = 'aaa'; s.match(/a+/) // ["aaa"]

上面代码中，模式是/a+/，表示匹配1个a或多个a，那么到底会匹配几个a呢？因为默认是贪婪模式，会一直匹配到字符a不出现为止，所以匹配结果是3个a。

如果想将贪婪模式改为非贪婪模式，可以在量词符后面加一个问号。

var s = 'aaa'; s.match(/a+?/) // ["a"]

上面代码中，模式结尾添加了一个问号/a+?/，这时就改为非贪婪模式，一旦条件满足，就不再往下匹配。

除了非贪婪模式的加号，还有非贪婪模式的星号（*）。

*?：表示某个模式出现0次或多次，匹配时采用非贪婪模式。

+?：表示某个模式出现1次或多次，匹配时采用非贪婪模式。

修饰符

修饰符（modifier）表示模式的附加规则，放在正则模式的最尾部。

修饰符可以单个使用，也可以多个一起使用。

// 单个修饰符 var regex = /test/i; // 多个修饰符 var regex = /test/ig;

（1）g修饰符

转载注明出处：https://www.heiqu.com/wyzxjd.html

深入浅析JavaScript中的RegExp对象(5)

相关推荐