就其本质而言,正则表达式(或 RE)是一种小型的、高度专业化的编程语言,要讲他的具体用法要讲一本书!它内嵌在Python中,并通过 re 模块实现。你可以为想要匹配的相应字符串集指定规则;该字符串集可能包含英文语句、e-mail地址、TeX命令或任何你想搞定的东西。然后你可以问诸如“这个字符串匹配该模式吗?”或“在这个字符串中是否有部分匹配该模式呢?”。你也可以使用 RE 以各种方式来修改或分割字符串。今天就来讲讲re模块的最常用的用法。
二、常用的正在表达式符号
'.'
#默认匹配除\n之外的任意一个字符,若指定flag DOTALL,则匹配任意字符
'^'
#匹配字符开头 同 '\A'
'$'
#匹配字符结尾 同 '\Z'
'*'
#匹配*号前的字符0次或多次
'+'
#匹配前一个字符1次或多次
'?'
#匹配前一个字符1次或0次
'{m}'
#匹配前一个字符m次
'{n,m}' #匹配前一个字符n到m次
'|'
#匹配|左或|右的字符
'\'
#转义
[a-z]
#匹配[a-z]
[A-Z]
#匹配[A-Z]
[0-9]
#匹配数字0-9
'\d'
#匹配数字0-9
'\D'
#匹配非数字
'\w'
#匹配字母数字下划线
'\W'
#匹配非字母数字下划线
'\s'
#匹配任意空白字符
'\S'
#匹配非任意空白字符
'[a-z]' #匹配中括号中的任意字符一次,有个注意点就是‘-’有特殊意义‘[-=+\]’这个括号内的‘-’放中间就会报错
'[^a-z]' #匹配非中括号内的字符