基于APACHE访问日志分析(access_log)的广告流量统计系统

基于APACHE访问日志分析(access_log)的广告流量统计系统。
原理: 被统计页面嵌入一段JS代码,完成数据收集,用户访问时将结束发送到Apache处理,保存到日志,由定时程序分析日志后保存到数据库。

原理图如下:

 

与mysql数据库统计相比,优点有:
a、统计过程中无额外负载,具备极高的负荷能力,单台服务器即可承受每日1000万 – 3000万 PV。
b、访问日志服务器是独立的,易于扩展,只需增加服务器即可。

2、基于以上流量统计系统的数据挖掘分析
新系统中每个浏览者都有一个独立标识,不仅仅是统计,而是用户统计,再基于用户标识进行数据挖掘分析。
该流量统计系统与YAHOO统计、站长统计原理相同,但功能更多,拟添加的主要功能模块有:

从用户访问我们网站开始,完整的记录用户的浏览次序,形成一个树状轨迹.同时记录用户的留言位置.

 

b. 统计访问者粘度:新访者的百分比,回访者的百分比,回访者访问次数和深度。
c. 统计和分析访问者信息:访问者IP(由此判断 国家、省份、城市,线路),操作系统、浏览器版本、屏幕分辨率、色彩深度、系统语言、系统时区。
d. 访问行为分析:访问者浏览页面的数量,访问者忠诚度,访问页面深度,访问页面时长,访问者停留时间。
e. 访问量和浏览量时段数据分析:每年/月/周/日/小时,目前在线用户分析。
f. 来源分析:来源域名分析,来源热门页面,搜索引擎蜘蛛访问日志
g. SEO和搜索引擎来源分析:关键字来源列表,单关键字效果追踪。
h. 报表输出:导出EXCEL,报表管理,统计项目明细
g. 更直观的表现形式:大量应用数据表格、flash图表,如下:

 

Leave a Reply

Your email address will not be published. Required fields are marked *