在许多技能规模(如:自然语言处理惩罚,数据存储等),正则表达式可以很利便的提取我们想要的信息,所以正则表达式是一个很重要的常识点!
一、观念
正则表达式(Regular Expression)是用于描写一组字符串特征的模式,用来匹配特定的字符串。通过非凡字符+普通字符来举办模式描写,从而到达文本匹配目标东西。
正则表达式今朝被集成到了各类文本编辑器/文本处理惩罚东西傍边
二、应用场景
(1)验证:表单提交时,举办用户名暗码的验证。
(2)查找:从大量信息中快速提取指定内容,在一批url中,查找指定url。
(3)替换:将指命名目标文本举办正则匹配查找,找到之后举办特定替换。
三、根基要素
(1)字符类
(2)数量限定符
(3)位置限定符
(4)非凡标记
留意:正则表达式根基是与语言无关的,我们可以团结语言/东西与正则表达式举办文本处理惩罚,在后头的博客中,我将利用grep来举办验证。(grep是一款Linux下按行匹配文本的东西,如下,使我们常利用的两个选项)
-E:利用扩展正则匹配
--color:将匹配获得的内容举办语法高亮
1.字符类
举譬喻下:
例1:
留意:1.grep回收的贪心匹配,它会匹配当前行中的所有匹配内容
2.echo $?暗示是否匹配乐成(假如乐成返回值为0,不乐成返回值为1)
例2:
例3:
例4:
例5:
2.数量限定符
举譬喻下:
例1:
例2:
由此,我们可以看出,“前面的单位”默认是指?或+前面的字符
例3:
例4:
例5:
例6:
留意:该功效为匹配失败,在相关文档中并未呈现,应该啊是错误可能废弃的用法
例7:
3.位置限定符
举譬喻下:
例1:
例2:
例3:
例4:
例5:
例6:
4.非凡标记
举譬喻下:
如果我们去掉-E选项,会有什么现象呢?
此时,不难发明,去掉-E选项之后没有举办正常的正则匹配,这种现象需要我们引入如下的两个观念!
5.根基正则表达式&扩展正则表达式