Linux用户管理、文本处理、安装包管理(4)

匹配次数:用在要指定次数的字符后面,用于指定前面的字符要出现的次数
   * 匹配前面的字符任意次,包括0次
   贪婪模式:尽可能长的匹配
   .* 任意长度的任意字符
   \? 匹配其前面的字符0或1次
   \+ 匹配其前面的字符至少1次
   \{n\} 匹配前面的字符n次
   \{m,n\} 匹配前面的字符至少m次,至多n次
   \{,n\} 匹配前面的字符至多n次
   \{n,\} 匹配前面的字符至少n次

位置锚定:定位出现的位置
   ^ 行首锚定,用于模式的最左侧
   $ 行尾锚定,用于模式的最右侧
   ^PATTERN$  用于模式匹配整行
   ^$  空行
   ^[[:space:]]*$  空白行
   \< 或 \b 词首锚定,用于单词模式的左侧
   \> 或 \b 词尾锚定;用于单词模式的右侧
   \<PATTERN\> 匹配整个单词

分组:\(\) 将一个或多个字符捆绑在一起,当作一个整体进行处理,如:\(root\)\+
  分组括号中的模式匹配到的内容会被正则表达式引擎记录于内部的变量中,这些变量的命名方式为: \1, \2, \3, ...
  \1  表示从左侧起第一个左括号以及与之匹配右括号之间的模式所匹配到的字符
    示例:  \(string1\+\(string2\)*\)
          \1 :string1\+\(string2\)*
          \2 :string2
后向引用:引用前面的分组括号中的模式所匹配字符,而非模式本身
  或者:\|
     示例:a\|b: a或b  C\|cat: C或cat  \(C\|c\)at:Cat或cat

文本处理常用工具

grep 全局搜索正则表达式并打印

  逐行处理,显示匹配到的

  -v 显示未匹配到的

  -i 忽略大小写

  -n:显示匹配的行号
  -c: 统计匹配的行数
  -o: 仅显示匹配到的字符串
  -q: 静默模式,不输出任何信息
  -A #: after, 后#行
  -B #: before, 前#行
  -C #:context, 前后各#行
  -e:实现多个选项间的逻辑or关系
     grep –e ‘cat ’  -e ‘dog’  file
  -w:匹配整个单词
  -E:使用ERE
  -F:相当于fgrep,不支持正则表达式

  (a|b)a或b

sed  Stream EDitor, 行编辑器

  sed是一种流编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。然后读入下行,执行下一个循环。如果没有使诸如‘D’的特殊命令,那会在两个循环之间清空模式空间,但不会清空保留空间。这样不断重复,直到文件末尾。文件内容并没有改变,除非你使用重定向存储输出。
功能:主要用来自动编辑一个或多个文件,简化对文件的反复操作,编写转换程序等
参考:

地址定界:
   (1) 不给地址:对全文进行处理
   (2) 单地址:
      #: 指定的行,$:最后一行
      /pattern/:被此处模式所能够匹配到的每一行
   (3) 地址范围:
      #,#
      #,+#
      /pat1/,/pat2/
      #,/pat1/
   (4) ~:步进
      1~2 奇数行
      2~2 偶数行

sed [option]... 'script' inputfile...
  常用选项:
  -n:不输出模式空间内容到屏幕,即不自动打印
  -e: 多点编辑
  -f:/PATH/SCRIPT_FILE: 从指定文件中读取编辑脚本
  -r: 支持使用扩展正则表达式
  -i.bak: 备份文件并原处编辑

  d: 删除模式空间匹配的行,并立即启用下一轮循环
  p:打印当前模式空间内容,追加到默认输出之后
  a [\]text:在指定行后面追加文本
       支持使用\n实现多行追加
  i [\]text:在行前面插入文本
  c [\]text:替换行为单行或多行文本
  w /path/somefile: 保存模式匹配的行至指定文件
  r /path/somefile:读取指定文件的文本至模式空间中匹配到的行后
  =: 为模式空间中的行打印行号
  !:模式空间中匹配行取反处理 

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/12673.html