grep (global search regular expression(RE) and print out the line,全面搜索正则表达式 并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。Unix 的 grep 家族包括 grep、egrep 和 fgrep。egrep 和 fgrep 的命令只跟 grep 有很小不同。egrep 是 grep 的扩展,支持更多的 re 元字符, fgrep 就是 fixed grep 或 fast grep,它们把所有的字母都看作单词,也就是说,正则表达式中的元字符表示回其自身的字面意义,不再特殊。linux 使用 GNU 版本的 grep。它功能更强,可以通过-G、-E、-F 命令行选项来使用 egrep和 fgrep 的功能。
grep 常用用法 # grep [-acinv] [--color=auto] '搜寻字符串' filename 选项与参数: -a :将 binary 文件以 text 文件的方式搜寻数据 -c :计算找到 '搜寻字符串' 的次数 -i :忽略大小写的不同,所以大小写视为相同 -n :顺便输出行号 -v :反向选择,亦即显示出没有 '搜寻字符串' 内容的那一行! --color=auto :可以将找到的关键词部分加上颜色的显示喔! 将/etc/passwd,有出现 root 的行取出来 # grep root /etc/passwd root:x:0:0:root:/root:/bin/bash operator:x:11:0:operator:/root:/sbin/nologin #或者 # cat /etc/passwd | grep root root:x:0:0:root:/root:/bin/bash operator:x:11:0:operator:/root:/sbin/nologin 将/etc/passwd,有出现 root 的行取出来,同时显示这些行在/etc/passwd 的行号 # grep -n root /etc/passwd 1:root:x:0:0:root:/root:/bin/bash 30:operator:x:11:0:operator:/root:/sbin/nologin在关键字的显示方面,grep 可以使用 --color=auto 来将关键字部分使用颜色显示。 这可是
个很不错的功能啊!但是如果每次使用 grep 都得要自行加上 --color=auto 又显的很麻烦~
此时那个好用的 alias 就得来处理一下啦!你可以在 ~/.bashrc 内加上这行:『alias
grep='grep --color=auto'』再以『 source ~/.bashrc 』来立即生效即可喔! 这样每次运
行 grep 他都会自动帮你加上颜色显示啦
字符类的搜索:如果我想要搜寻 test 或 taste 这两个单字时,可以发现到,其实她们有共通
的 't?st' 存在~这个时候,我可以这样来搜寻:
其实 [] 里面不论有几个字节,他都谨代表某『一个』字节, 所以,上面的例子说明了,我需
要的字串是『tast』或『test』两个字串而已!
如果想要搜索到有 oo 的行,但不想要 oo 前面有 g,如下
[root@onajax.com ~]# grep -n '[^g]oo' onajax.com.txt 2:apple is my favorite food. 3:Football game is not use feet only. 18:google is the best tools for search keyword. 19:goooooogle yes!第 2,3 行没有疑问,因为 foo 与 Foo 均可被接受!
但是第 18 行明明有 google 的 goo 啊~别忘记了,因为该行后面出现了 tool 的 too 啊!
所以该行也被列出来~ 也就是说, 18 行里面虽然出现了我们所不要的项目 (goo) 但是由於
有需要的项目 (too) , 因此,是符合字串搜寻的喔!
至於第 19 行,同样的,因为 goooooogle 里面的 oo 前面可能是 o ,例如:go(ooo)oogle ,
所以,这一行也是符合需求的!
假设 oo 前面不想要有小写字节,所以,我可以这样写 [^abcd....z]oo ,
但是这样似乎不怎么方便,由於小写字节的 ASCII 上编码的顺序是连续的, 因此,我们可以将之简化为底下这样:
也就是说,当我们在一组集合字节中,如果该字节组是连续的,例如大写英文/小写英文/数字等等, 就可以使用[a-z],[A-Z],[0-9]等方式来书写,那么如果我们的要求字串是数字与英文,将他全部写在一起,变成:[a-zA-Z0-9]。
我们要取得有数字的那一行,就这样:
行首字符:如果我想要让 the 只在行首列出呢? 这个时候就得要使用定位字节了!
[root@onajax.com ~]# grep -n '^the' onajax.com.txt 12:the symbol '*' is represented as start.