Python数据分析学习-re正则表达式模块

正则表达式 为高级的文本模式匹配、抽取、与/或文本形式的搜索和替换功能提供了基础。简单地说,正则表达式(简称为 regex)是一些由字符和特殊符号组成的字符串,它们描述了模式的重复或者表述多个字符,于是正则表达式能按照某种模式匹配一系列有相似特征的字符串。换句话说,它们能够匹配多个字符串……一种只能匹配一个字符串的正则表达式模式是很乏味并且毫无作用的,不是吗?Python 通过标准库中的 re 模块来支持正则表达式

正则表达式的特殊字符列表

'.' 匹配所有字符串,除\n以外
‘-’ 表示范围[0-9]
**'*' 匹配前面的子表达式零次或多次。要匹配 * 字符,请使用 *。
'+' 匹配前面的子表达式一次或多次。要匹配 + 字符,请使用 +
'^' 匹配字符串开头
‘$’ 匹配字符串结尾 re
''** 转义字符, 使后一个字符改变原来的意思,如果字符串中有字符*需要匹配,可以*
**'*' 匹配前面的字符0次或多次
‘?’ 匹配前一个字符串0次或1次
'{m}' 匹配前一个字符m次
'{n,m}' 匹配前一个字符n到m次
'\d' 匹配数字,等于[0-9]
'\D' 匹配非数字,等于[^0-9]
'\w' 匹配字母和数字,等于[A-Za-z0-9]
'\W' 匹配非英文字母和数字,等于[^A-Za-z0-9]
'\s' 匹配空白字符
'\S' 匹配非空白字符
'\A' 匹配字符串开头
'\Z' 匹配字符串结尾
'\b' 匹配单词的词首和词尾,单词被定义为一个字母数字序列,因此词尾是用空白符或非字母数字符来表示的
'\B' 与\b相反,只在当前位置不在单词边界时匹配
'(?P

Python的re正则表达式模块提供的方法

re.match(pattern, string, flags=0) #从字符串的起始位置匹配,如果起始位置匹配不成功的话,match()就返回none re.search(pattern, string, flags=0) #扫描整个字符串并返回第一个成功的匹配 re.findall(pattern, string, flags=0) #找到RE匹配的所有字符串,并把他们作为一个列表返回 re.finditer(pattern, string, flags=0) #找到RE匹配的所有字符串,并把他们作为一个迭代器返回 re.sub(pattern, repl, string, count=0, flags=0) #替换匹配到的字符串

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/wpppdj.html