Shell脚本学习:快速理解正则表达式之grep篇

shell脚本是Linux的核心之一,而正则表达式是shell脚本的核心之一,理解正则表达式可以快速匹配需要查找的内容,对以后的shell脚本编程打下一个坚实的基础。

接触正则表达式一般从grep命令开始,例如:

grep "^#[:space:]*" /etc/inittab

这个命令中“^#[:space:]*”就是正则表达式的内容,它的意思是“以#开头后跟任意个空格”,结合grep命令,就是显示/etc/inittab文件里“以#开头后跟任意个空格”的内容。

grep命令的作用是查找匹配的内容并打印出来

grep [option]  正则表达式 要查抄的文件

-i   不区分大小写

-color    以高亮显示匹配的文本内容

-E  使用扩展的元字符

-v   取反

那么正则表达式分有哪些?

——————————————————————

在shell里,正则表达式分为,标准元字符、扩展元字符

标准元字符: ^  $  .  *  []  [x-y]  [^]  \  \<  \>  \(...)\   x\{m\n}

扩展元字符: ^  $  .  *  []  [^]   +  ?   a|b   ()          

相关资料:

#可在上面的链接里查到各自的意思

另外一个重要的知识:posix方括号字符集       

[:alnum:]            [:lower:]          [:xdigit:]

[:alpha:]             [:print:]            [:blank:]

[:blank:]             [:punct:]

[:cntrl:]               [:space:]

[:graph:]             [::upper:]

上面的例子grep "^#[:space:]*" /etc/inittab 里[:space:]代表空白字符,posix字符集和正则表达式配合使用可以产生很强大的功能,许多时候我们都可以借助它来实现自己的目的。

例如:显示/boot/grub/grub.conf文件中以一个或多个空白字符开头的行

grep "^[[:space:]]\{1,\}" /boot/grub/grub.conf

这个命令里注意 ^和[]的使用,通常^[]用来匹配开头是某个字符,^[[:space:]]因为要求匹配的是开头是空白字符,所以用[[:space:]]而不是[:space:],如果错误的写成^[:space:]那么就锚定[]里的内容,现在知道[]的作用了吧:锚定某个字符,多个代表多个可能 

下面几个难度稍高一点的练习来学习理解正则表达式

1.显示/etc/inittab文件中以一个数字开头并以一个与开头数字相同的数字结尾的行;
   2.ifconfig命令可以显示当前主机的IP地址相关的信息等,如果使用grep等文本处理命令取出本机的各IP地址,要求不包括127.0.0.1;
   3.显示/etc/sysconfig/network-scripts/ifcfg-eth0文件中的包含了类似IP地址点分十进制数字格式的行; 

##答案:

1.  grep "^\([0-9]\).*\1$" /etc/inittab

2.  ifcofig | grep "inet addr" | grep -v '127.0.0.1' | cut -d: -f2 | cut -d "" f1

3.  grep -E "([0-9]{1,3}\.){3}\.[0-9]{1,3}" /etc/sysconfig/network-scripts/ifcfg-eth0

grep "[0-9]\{1,3\}\.\"{3\}\.[0-9]\{1,3\} /etc/sysconfig/network-scripts/ifcfg-eth0

##解析

1. ^[0-9]锚定开头的数字 使用\(...\)   \1   将^[0-9]传递给\1 $用来锚定结尾

2.  首先grep提出去含有inet addr的内容,-v取出‘127.0.0.1’使用cut命令 -d 来截取第一个字段

3.  使用-E解法 ([0-9])\{1,3}    [0-9]的数字至少出现1次,至多出现3次   \.  转义 . 符号 {3} 显示三次前面()的内容\.[0-9]{1,3}匹配后面的3位数字                                    

##grep解法可以自己琢磨下

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/wwjfjy.html