shell脚本是Linux的核心之一,而正则表达式是shell脚本的核心之一,理解正则表达式可以快速匹配需要查找的内容,对以后的shell脚本编程打下一个坚实的基础。
接触正则表达式一般从grep命令开始,例如:
grep "^#[:space:]*" /etc/inittab
这个命令中“^#[:space:]*”就是正则表达式的内容,它的意思是“以#开头后跟任意个空格”,结合grep命令,就是显示/etc/inittab文件里“以#开头后跟任意个空格”的内容。
grep命令的作用是查找匹配的内容并打印出来
grep [option] 正则表达式 要查抄的文件
-i 不区分大小写
-color 以高亮显示匹配的文本内容
-E 使用扩展的元字符
-v 取反
那么正则表达式分有哪些?
——————————————————————
在shell里,正则表达式分为,标准元字符、扩展元字符
标准元字符: ^ $ . * [] [x-y] [^] \ \< \> \(...)\ x\{m\n}
扩展元字符: ^ $ . * [] [^] + ? a|b ()
#可在上面的链接里查到各自的意思
另外一个重要的知识:posix方括号字符集
[:alnum:] [:lower:] [:xdigit:]
[:alpha:] [:print:] [:blank:]
[:blank:] [:punct:]
[:cntrl:] [:space:]
[:graph:] [::upper:]
上面的例子grep "^#[:space:]*" /etc/inittab 里[:space:]代表空白字符,posix字符集和正则表达式配合使用可以产生很强大的功能,许多时候我们都可以借助它来实现自己的目的。
例如:显示/boot/grub/grub.conf文件中以一个或多个空白字符开头的行
grep "^[[:space:]]\{1,\}" /boot/grub/grub.conf
这个命令里注意 ^和[]的使用,通常^[]用来匹配开头是某个字符,^[[:space:]]因为要求匹配的是开头是空白字符,所以用[[:space:]]而不是[:space:],如果错误的写成^[:space:]那么就锚定[]里的内容,现在知道[]的作用了吧:锚定某个字符,多个代表多个可能
下面几个难度稍高一点的练习来学习理解正则表达式
1.显示/etc/inittab文件中以一个数字开头并以一个与开头数字相同的数字结尾的行;
2.ifconfig命令可以显示当前主机的IP地址相关的信息等,如果使用grep等文本处理命令取出本机的各IP地址,要求不包括127.0.0.1;
3.显示/etc/sysconfig/network-scripts/ifcfg-eth0文件中的包含了类似IP地址点分十进制数字格式的行;
##答案:
1. grep "^\([0-9]\).*\1$" /etc/inittab
2. ifcofig | grep "inet addr" | grep -v '127.0.0.1' | cut -d: -f2 | cut -d "" f1
3. grep -E "([0-9]{1,3}\.){3}\.[0-9]{1,3}" /etc/sysconfig/network-scripts/ifcfg-eth0
grep "[0-9]\{1,3\}\.\"{3\}\.[0-9]\{1,3\} /etc/sysconfig/network-scripts/ifcfg-eth0
##解析
1. ^[0-9]锚定开头的数字 使用\(...\) \1 将^[0-9]传递给\1 $用来锚定结尾
2. 首先grep提出去含有inet addr的内容,-v取出‘127.0.0.1’使用cut命令 -d 来截取第一个字段
3. 使用-E解法 ([0-9])\{1,3} [0-9]的数字至少出现1次,至多出现3次 \. 转义 . 符号 {3} 显示三次前面()的内容\.[0-9]{1,3}匹配后面的3位数字
##grep解法可以自己琢磨下