利用光年日志分析工具进行的一次网站日志分析

2012年4月27日 | 标签:

工具:光年日志分析工具2.0免费版 http://www.semyj.com/archives/1539里面有工具用法的介绍

这里主要是讲下我们实际工作中怎么使用这个工具 整理数据

工具是死的 得到的数据也是冷冰冰的 但是分析的人是活的 需要讲这些数据结合网站的具体情况分析 然后得到一些结论 以及导致这些问题的原因 最后是解决办法

首先需要找管理服务器的人 或者ftp上(有些虚拟主机是提供最新3天的日志下载)下载这个log文件

log文件里面记录了网站上每个文件被引用的状态 被谁 什么时候

一般服务器上日子文件保存的几个月甚至几年的都有 如果访问量比较大 这些日志文件也变得非常的臃肿 所以光年

工具在速度上还是很值得称道的 很快就会得到下面的数据

列出了所有搜索引擎对网站资源的抓取信息 如果你看到里面百度没有来你网站 那么你很可能就是被k了 或者降权了 也很难得到百度的权重

订单

把这些数据都整理到excel中方便做图分析 和做给老板看

好的员工不应该是单打独斗而是要让你的上司知道你的思考的过程以及采取的策略 而不是自己发现 自己解决

这是做营销的人的应该懂的 怎么去营销自己

从这个图就可以方便的知道 这么多搜索引擎 只有搜狗是抓的最多的但是结合流量和市场占比来看 抓这么多 带来的流量这么少

是不是可以考虑对他做些限制 或者看下为什么他抓这么多页面 其他抓这么少

 

这里交代下网站背景 是从事b2b行业的

/campaign/是做sem的landing page的目录 目前做百度和谷歌的sem

/colleage/是做行业内的最新的新闻动态的页面 每个星期都会更新内容

/search/ 是这个b2b行业内客户的信息 里面有上万客户的信息 这也是seo优化的重点 因为内容多 但是单个页面信息量比较少 难得获得权重

/showcase/是这个公司的案例分析 比较信息

/solution/是这个公司的主要产品信息

然后对4个搜索引擎每个引擎中抓取的目录的页面进行分析 得到不同的action

百度的大部分时间都在抓取/Campaign/这目录 但是这个目录是做sem的目录 对seo意义不大是不是可以考虑屏蔽百度蜘蛛,或者判断应该百度抓取网页和抓取sem 的langdingpage使用的是同一种蜘蛛 所以会重复抓取

谷歌抓取的特点是他会抓取en目录下 也就是英文页面 百度就不怎么喜欢英文的 所以抓取占比少

 

 

  1. 2019年3月25日10:05

    学习了,感谢博主