日志分析(二):功能简析

  • A+
所属分类:SEO入门

网站日志分析

每一个SEO人员或者站长都知道网站日志,然而真正可以每天或者有规律性的去查看网站日志以及懂得如何去分析网站日志的并不多。甚至在一些公司,大多SEO朋友并不能接触到与此有关的一些权限,所以很多时候,对于网站日志只知其然而不知其所以然。

我们可以从网站日志里面看出很多许多关于网站的相关信息,从而利用网站日志的诊断和分析来提高网站关键词的排名、解决网站的相关问题等。下面我们来简要的谈谈对网站日志分析的意义。

1)概要分析:可以知道搜索引擎蜘蛛的类别,对于我们网站的访问次数、总停留时间、总抓取量等情况。

意义:从这些数据我们可以看出蜘蛛的活跃程度、亲和程度、抓取深度等,总访问次数、总停留时间、总抓取量越高,表明网站越受搜索引擎喜欢。而通过搜索引擎蜘蛛类别数据的分析,可以大致分析出网站在各搜索引擎的受欢迎程度和SEO效果从而做出相关调整,毕竟很多公司做SEO对于搜索引擎的选择是有要求的,比如国内绝大多数公司都是做百度的,对于Google、360、搜狗等却没有太多相关要求。

2)目录抓取:统计网站目录抓取情况

意义:通过日志分析我们可以看到网站哪些目录受蜘蛛喜欢、抓取目录深度、重要页面目录抓取状况、无效页面目录抓取状况等。通过对比目录的抓取情况以及目录下页面抓取及收录情况,我们可以发现更多问题。对于重要目录,我们需要通过内外调整增加权重及爬取;对于目录下无效页面,需要进行屏蔽。

3)页面抓取:统计网站页面抓取情况

意义:在网站日志分析中,我们可以看到具体被蜘蛛爬取的页面。在这些页面中,我们可以分析出蜘蛛爬取了哪些可能需要被屏蔽的页面,比如重复页面、低质量页面、空内容页面、404页面、不排名页面等;对于一些重要页面,则可以根据抓取的情况进行相应策略的调整。

4)IP排行:蜘蛛的访问IP

意义:通过日志分析出蜘蛛访问的ip,不仅可以判别各类搜索引擎蜘蛛的IP类型,同时也可以知道搜索引擎对网站的态度与抓取目地,以及相关抓取蜘蛛IP的归属地。这里要说明的是,同类搜索引擎蜘蛛根据抓取目地的不同、源地理位置的不同,IP地址也是有所区别的。

5)蜘蛛状态码:统计搜索引擎蜘蛛抓取网页的状态码

意义:蜘蛛的状态码是我们SEO人员、站长要仔细且认真对待的,蜘蛛在访问了我们网站无论是目录还是页面,都会有相应的返回状态码,分析蜘蛛留下的状态码我们可以知道哪些目录、页面是可以被蜘蛛成功访问的,哪些则不能访问或者出现其他相关问题,然后快速做出相应的解决方案,进行调整。

区别于蜘蛛状态码,还有一种是用户状态码,用来统计用户访问网站行为轨迹及用户属性等数据,在这里就不进行描述了。

6)抓取时间:搜索引擎蜘蛛抓取时间的相关参数

意义:通过分析对比多个单日蜘蛛小时爬取量,我们可以了解到特定蜘蛛对于本网站在特定时间的活跃时段。通过对比周数据,我们可以看到特定蜘蛛在一周中的活跃周期。根据这些规律,我们可以更好的设置网站的内容更新时段。

以上只是对日志分析相关功能与意义的简单描述,更多功能需要大家亲自去尝试、开发,且网站日志分析更大的作用更在于我们在得到相关信息、数据之后,我们发现了哪些问题,产生了怎么样的思考,我们为之付诸了多少求知、实践的行动。

比如说通常为了优化我们会简化网页的内容,那么内容网页的文字量与内容网页的访问频率究竟是怎么一个关系?

比如说站在用户最基本的搜索需求上来看,链接的结构深度对于用户的最终访问需求页面是否有影响?

比如说网站的某些重要目录、页面被抓取之后,却迟迟无法被收录、索引,这里面又有哪些原因?

比如说某个页面返回的状态码为200而不是404,但访问页面却跳转到404页面,这又是什么原因?

.....

最后,对于网站日志中出现的搜索引擎蜘蛛,被搜索引擎蜘蛛抓取的相关数据,我们该如何去屏蔽我们所不希望访问我们网站的搜索引擎蜘蛛以及屏蔽那些不想被抓取的网站文件、页面呢?下一章robots会进行相应的阐述!

weinxin
宁缺SEO
宇宙之大,学海无涯。扫一扫,关注微信公众号,查看最新好文章!

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: