以前,我还在自己用Python或AWK写脚本来分析我的博客上面的访问日志,现在我选择使用GoAccess这个强大的工具!~ (PS: 也同时在用强大的Google Analytics作为长期分析的工具)
用GoAccess主要有几个原因:1. 支持通用的日志格式,Apache/Nginx/Lighttpd的日志都可以; 2. 丰富的输出形式,包括:Terminal直接看,HTML报告,JSON/CSV等利于程序二次加工的输出; 3. 效率较高:每秒可以处理几万行记录(目前基本够用,大规模网站中可以对其进行加强或采用离线处理方式) ; 4. 开源/免费。
使用GoAccess前,系统需要在Web服务器上安装一些依赖,如CentOS上
1 2 |
yum groupinstall 'Development Tools' yum install glib2 glib2-devel ncurses-devel |
在Ubuntu上:
1 2 |
sudo apt-get install build-essential sudo apt-get install libglib2.0-dev libncursesw5-dev |
目前GoAccess的最新版本是0.9,到其官网(http://goaccess.io/)下载,然后编译/安装即可,不必详述。
展示一下,用GoAccess分析我的Bugzilla的access log吧。
在Terminal中运行“goaccess -f /var/log/nginx/access.log”运行时的交互式展示如下:
运行"goaccess -f access.log -a > report.html“命令后,生成的HTML报告在浏览器中展示如下:
参考资料:
http://goaccess.io/