$ awk '{count[$1]++} END{for(name in count) print name,count[name]}' test #该语句将打印$1中字符串出现的次数。它首先以第一个域作数组count的下标,第一个域变化,索引就变化。
delete 函数用于删除数组元素。例如:
$ awk '{line[x++]=$1} END{for(x in line) delete line[x]}' test #分配给数组line的是第一个域的值,所有记录处理完成后,special for循环将删除每一个元素。
14.8. awk的内建函数 14.8.1. 字符串函数
sub 函数匹配记录中最大、最靠左边的子字符串的正则表达式,并用替换字符串替换这些字符串。如果没有指定目标字符串就默认使用整个记录。替换只发生在第一次匹配的时候。格式如下:
sub (regular expression, substitution string): sub (regular expression, substitution string, target string)
实例:
$ awk '{ sub(/test/, "mytest"); print }' test #在整个记录中匹配,只替换每行第一次匹配到字段。如要替换每行匹配到的所有字段需要用到gsub $ awk '{ sub(/test/, "mytest",$2); print }' test #在整个记录的第二个域中进行匹配,只替换每行第一次匹配到字段。
gsub 函数作用如sub,但它在整个文档中进行匹配。格式如下:
实例:
$ awk '{ gsub(/test/, "mytest"); print }' testfile #文档中匹配test,匹配的都被替换成mytest。 $ awk '{ gsub(/test/, "mytest" , $2) }; print }' testfile #文档的第二个域中匹配,所有匹配的都被替换成mytest。
index 函数返回子字符串第一次被匹配的位置,偏移量从位置1开始。格式如下:
index(string, substring)
实例:
$ awk '{ print index("mytest", "test") }' test #实例返回test在mytest的位置,结果应该是3。
length 函数返回记录的字符数。格式如下:
length( string ) length
实例:
$ awk '{ print length( "test" ) }' #返回test字符串的长度 $ awk '{ print length }' test #返回test文件中第条记录的字符数
split 函数可按给定的分隔符把字符串分割为一个数组。如果分隔符没提供,则按当前FS值进行分割。格式如下:
split( string, array, field separator ) split( string, array )
实例:
$ awk '{ split( "20:18:00", time, ":" ); print time[2] }' #上例把时间按冒号分割到time数组内,并显示第二个数组元素18。
substr 函数返回从位置1开始的子字符串,如果指定长度超过实际长度,就返回整个字符串。格式如下:
substr( string, starting position ) substr( string, starting position, length of string )
实例:
$ awk '{ print substr( "hello world", 7,11 ) }' #截取了world子字符串。
match 函数返回在字符串中正则表达式位置的索引,如果找不到指定的正则表达式则返回0。match函数会设置内建变量RSTART为字符串中子字符串的开始位置,RLENGTH为到子字符串末尾的字符个数。substr可利于这些变量来截取字符串。函数格式如下:
match( string, regular expression )
实例:
$ awk '{start=match("this is a test",/[a-z]+$/); print start}' #打印以连续小写字符结尾的开始位置,这里是11。 $ awk '{start=match("this is a test",/[a-z]+$/); print start, RSTART, RLENGTH }' #打印RSTART和RLENGTH变量,这里是11(start),11(RSTART),4(RLENGTH)。
toupper 和tolower 函数可用于字符串大小间的转换,该功能只在gawk中有效。格式如下:
toupper( string ) tolower( string )
实例:
$ awk '{ print toupper("test"), tolower("TEST") }'
14.8.2. 时间函数
systime函数返回从1970年1月1日开始到当前时间(不计闰年)的整秒数。格式如下:
systime()
实例:
$ awk '{ now = systime(); print now }'
strftime函数使用C库中的strftime函数格式化时间。格式如下:
systime( [format specification][,timestamp] )