1、创建正则表达式
第一种方式:注意这里的正则表达式不能使用单引号或者双引号,如下
var pattern1 = /[abc]/i; // 匹配第一个"a"或"b"或"c",不区分大小写
第二种方式:使用RegExp构造函数创建,该构造函数传入两个参数,都是字符串,所以需要特别注意"\"符号的转换,所有元字符(下面有讲元字符)需要双重转义,如下
复制代码 代码如下:
var patt1 = new RegExp("[abc]","gi"); // 这里等价于 var patt1 = /[abc]/gi;
alert("[abc]".match(patt1)); // return a
var patt2 = new RegExp("\\[abc\\]","gi"); // 这里等价于 var patt2 = /\[abc\]/gi; 而在引号内"\"必须转移为"\\"
alert("[abc]".match(patt2)); // return [abc]
说到这里思考两个问题:
a、如果这里的正则表达式,是通过字符串和某个变量动态组合而成的,如何使用第一种方式创建正则表达式?
显然,用第二种创建正则表达式的方式,肯定没有任何问题,因为,传入的第一个参数本身就是一个字符串。要用第一种方式创建,这里需要用到eval()函数,如下
复制代码 代码如下:
var str = "abc"; // 这可能是一个动态的变量
var patt1 = eval("/\\["+str+"\\]/"); // 等价于 var patt1 = /\[abc\]/;
alert("[abc]".match(patt1)); // return [abc]
b、上面两种创建方法有什么不同之处?
《javascript高级程序设计(第三版)》中讲:区别在于是否共享,使用第一种方式创建的正则,共享,第二种不共享。经楼主实践发现结果有点出入,两种创建方式结果一样,都是(true true true),各位可以自行测试。所以这里MARK一下,这两种创建方式没什么区别。
复制代码 代码如下:
var re = null,i;
for(i=0;i<3;i++){
re = /cat/g;//书:实例属性不会重置,下面的结果应该是 true false true
alert(re.test("catasdfdfdf"));
}
for(i=0;i<3;i++){
re = new RegExp("cat","g");//书:实例属性会重置,下面的结果应该是 true true true
alert(re.test("catasdfdfdf"));
}
这里顺便讲一下匹配模式的三个标志:g、i、m
g:设置了g之后,模式被应用于所有字符串,发现第一个匹配项后,不会立即停止,模式的lastIndex会移至下一个位置,待下一次应用此模式的时候,再次从lastIndex开始匹配,如果匹配到最后了,lastIndex才会被重置为0;
i:这个很好理解,不区分大小写;
m:表示多行模式,即在到达一行文本末尾的时候还会继续查找下一行,进行匹配;
2、元字符: ( [ { \ ^ $ | ) ? * + . ] }
这些字符在正则表达式中有一或多种特殊用途,因此如果想匹配这些字符,都需要进行转义。如:
复制代码 代码如下:
var pattern1 = /\[abc\]/i; // 匹配第一个"[abc]",不区分大小写
var pattern2 = /[abc]/i; // 匹配第一个"a"或"b"或"c",不区分大小写
3、RegExp实例属性
global、ignoreCase、multiline、lastIndex、source,这些属性用处不大,其中lastIndex可用于调试,简单示例
复制代码 代码如下:
var patt1 = /cat/g;
patt1.test("catasdfdfdf");
dw(patt1.global); // 是否设置了g,全局模式 // true
dw(patt1.ignoreCase); // 是否设置了i,不区分大小写 // false
dw(patt1.multiline); // 是否设置了m,多行匹配,到了一行末尾,能够继续匹配下一行 // false
dw(patt1.lastIndex); // 表示开始搜索下一个匹配项的开始位置,第一次为0 // 3
dw(patt1.source); // 返回正则表达式字面量 // cat
4、范围集合类:[] ^ |
[abc],表示a或者b或者c中的任意一个字符
[a-z]、[A-Z]、[0-9],表示小写字母,大写字母,0到9的数字
[^a-z]、[^A-Z]、[^0-9],表示非小写字母,非大写字母,非0到9的数字
[abc|def],表示abc和def中的任意一个
复制代码 代码如下:
alert(/[abc]/.test("a"));//true
alert(/[abc]/.test("gg"));//false
alert(/[^abc]/.test("a"));//false
alert(/[^abc]/.test("gg"));//true
alert(/[a-z]/.test("A"));//false
alert(/[A-Z]/.test("A"));//true
alert(/[abc|def]/.test("def"));//true
5、量词类:? * + {m} {m,n} {m,}
? 0或1次,放在量词后面,表示非贪婪品匹配,后面讲解
* 0或多次
+ 1或多次
{m} m次
{m,n} 至少m次,至多n次
{m,} 至少m次
复制代码 代码如下:
alert(/a?/.test("a"));//true
alert(/a?/.test("b"));//true 可以出现0次
alert(/a*/.test("a"));//true
alert(/a*/.test("b"));//true 可以出现0次
alert(/a+/.test("a"));//true
alert(/a+/.test("b"));//false
alert(/a{3}/.test("aaaaa"));//true
alert(/a{3}/.test("bbbbb"));//false 看到网上一些文章将,这里应该是0或者3次,这里楼主测试了几个浏览器,没有0次
alert(/a{3,5}/.test("aaaaa"));//true
alert(/a{3,5}/.test("bbbbbb"));//false
alert(/a{3,}/.test("aaaaa"));//true
alert(/a{3,}/.test("bbbbbb"));//false
6、边界类: ^ $ \b \B
^ 表示开头的标志,注意,不能紧接着左中括号,比如[^A-Z],这样表示非
$ 表示结尾的标志
\b 单词边界的标志,这样理解,它表示单词间那个看不到的东西,一侧是单词字符,一侧是非单词字符(包括各种标点和空白字符或中文)
\B 非单词边界的标志
复制代码 代码如下: