RedHat Linux 5 性能测试及监控(2)

日期：2020-05-31 栏目：程序人生浏览：次

apache 的日志监控
1.处理单个日志。统计每一天各篇文章的访问量（）。
代码：　
awk '$9 == 200 {print $7}' www-01.log | grep -i '^/blog/2011/.*\.html$' | sort | uniq -c | sed 's/^ *//g' > www-01.log.result
它用管道连接了5个命令，每一个都很简单，我们依次来看：
（1）awk '$9 == 200 {print $7}' www-01.log
awk命令默认用空格，将每一行文本分割成若干个字段。仔细数一下，我们需要的只是第7个字段，即http请求的网址，{print $7}表示将第7个字段输出，结果就是：/blog/2009/11/an_autobiography_of_yang_xianyi.html
（2）grep -i '^/blog/2011/.*\.html$'
在输出的所有记录的第7个字段之中，并不是每一条记录都需要统计的。根据我的文章的命名特点，它们的网址应该都以"/blog/2011/"开头，以".html"结尾。所以，我用一个正则表达式"^/blog/2011/.*\.html$"，找出这些记录。参数i表示不区分大小写。
（3）sort
这时，所有需要统计的记录应该都列出来了，但是它们的次序是杂乱的。接着，使用sort命令，不过目的不是为了排序，而是把相同的网址排列在一起，为后面使用uniq命令创造条件。
（4）uniq –c
uniq的作用是过滤重复的记录，只保留一行。c参数的作用，是在每行的开头添加该记录的出现次数。
（5）sed 's/^ *//g' > www-01.log.result
上一步uniq命令添加的访问次数，是有前导空格的。也就是说，在上例的32、32、30之前有一连串空格，为了后续操作的方便，这里把前导空格删去。sed命令是一个处理行文本的编辑器，'s/^ *//g'是一个正则表达式（^和*之间有一个空格），表示将行首的连续空格替换为空（即删除）。接着，将排序结果重定向到文件www-01.result。单个日志分析就完成了。

另外可以从网上下载一些工具，也可以实现统计
例如：webalizer awstat
apache 日志分析工具webalizer网址

Webalizer特性
1. 为是用C写的程序，所以其具有很高的运行效率。在主频为200Mhz的机器上，webalizer每秒钟可以分析10000条记录，所以分析一个40M大小的日志文件只需要15秒。
2. webalizer支持标准的一般日志文件格式(Common Logfile Format)；除此之外，也支持几种组合日志格式(Combined Logfile Format)的变种，从而可以统计客户情况以及客户操作系统类型。并且现在webalizer已经可以支持wu-ftpd xferlog日志格式以及squid日志文件格式了。
3. 支持命令行配置以及配置文件。
4. 可以支持多种语言，也可以自己进行本地化工作。
5. 支持多种平台，比如UNIX、linux、NT, OS/2 和 MacOS等。
Webalizer安装
1.从webalizer的官方站点下载webalizer，当前的最新版本是2.23-05。
2.首先解开源代码包：
tar -xvzf webalizer-2.01-06-src.tgz
3.在生成的目录中有个lang目录，该目录中保存了各种语言文件，但是只有繁体中文版本，可以自己转换成简体，或者自己重新翻译一下。
4.然后进入生成的目录：
图4
执行./configure
--sysconfdir=/etc 配置脚本存放位置
--with-geodb=<path> 是否结合地理位置显示
make --with-language=chinese
5.编译成功后，会产生一个webalizer可执行文件，可以将其拷贝到/usr/sbin/目录下：
cp webalizer /usr/sbin/

转载注明出处：http://www.heiqu.com/19306.html

RedHat Linux 5 性能测试及监控(2)

相关推荐