晋升seo网站总监必备:seo网站日志分析

 SEO优化教程     |      2018-08-21 14:10

  晋升seo网站总监必备:seo网站日志分析

  网站日志分析对seo数据分析也是很重要的,尤其新站或网站碰到某些问题需要分析的时候,但是大部分seoer新手都不会网站日志的分析或者是只会用分析软件看看日志蜘蛛来过没有,网站页面的状态码是否正常,这是常见的新手朋友网站日志分析时的流程。推荐:seo视频教程:网站日志分析

  分析网站日志可以观察搜索引擎的蜘蛛来我们网站的爬取情况,可以更近距离的分析和接触蜘蛛。爬取次数,爬取时间点,爬取高峰期,汕尾网站优化,爬取反应出来的HTTP状态码,为我们带来清晰的分析便利。

  案例日志:61.135.168.22 - - [11/Jan/2009:04:02:45 +0800] "GET /thread-7303-1-1.html HTTP/1.1" 200 8450 "-" "Baiduspider(+http:-www-baidu-com/search/spider.htm)"

  分析:

  1、61.135.168.22 是访问了是服务器IP为这个的网站.

  2、11/Jan/2009:04:02:45 表示蜘蛛爬行时间

  3、GET /thread-7303-1-1.html HTTP,表示蜘蛛抓取了这个页面。

  4、200 状态码表示蜘蛛抓取页面成功;404表示蜘蛛抓取页面失败。

  5、8450 表示此次抓取了8450个字节

  6、Baiduspider(+http:-www-baidu-com/search/spider.htm)表示百度蜘蛛的名称

  基本状态码:

  200:请求已经完成,蜘蛛访问页面正常

  301:已经移动,永久重定向

  302:临时重定向

  304:蜘蛛爬取后发现,页面没有修改

  305:使用代理

  400:请求错误

  404:找不到页面

  这里seo知否小编就更详细的写写iis网站日志分析流程:

  用ultraedit打开后,按CTRL+F键,弹出窗口(如图1),输入Googlebot,按回车,在新窗口中显示的页面就是google机器人的到访问记录,汕尾SEO,选中其中之一双击,可以看到访问的时间和页面(如图2),在这里要注意的是所显示的时间是国际标准时间,所以要在这个时间上加8个小时,这样才是北京时间,如果是自己的独立服务器可以设置为北京时间,这里就不详述了。

  

1.png


  

2.png


  我们继续查找Baiduspider可以看到baidu蜘蛛的爬行记录。其他搜索引擎通过查找如Yahoo、Sogou、msnbot、YodaoBot… 比如我们新做了一个网站,也在百度和google中提交了,可是site站点的时候就是看不到收录的页面,这时我们就可以利用上面的方法查看一下IIS日志,只要百度和google等搜索引擎的蜘蛛已经爬行过我们的站点了,我们就不用担心网站的收录问题了,搜索引擎会慢慢的放出已经抓取的页面,站长们继续增加内容就行了。通过此项查找还可以了解搜索引擎的到访时间和抓取页面的时间及频率。

  上面是通过IIS日志查看搜索引擎的爬行记录,可能有人会问了,为什么搜索引擎的爬行记录不能被流量统计工具统计到?因为流量统计代码是采用JS调用的方式,搜索引擎蜘蛛爬行时不会调用JS文件。我们可以自己写个流量统计功能,然后include流量统计功能的这个动态页面到各个页面中,这样所有对页面的访问就都可以统计到了,并且通过agent参数,可以判断来自哪个搜索引擎,这里不再详述。

  通过IIS日志查找网站是否存在死链接:

  在用ultraedit打开的IIS日志文件中按CTRL+F键,在出现的窗口中(如图1),选中第一和第三个复选框,输入404,然后按回车,看看在弹出的窗口中有没有找到记录。如果找到,说明你的网站存在死链接,大家都知道死链接对网站的收录是有影响的,怎么去处理就不用我说了吧。

  下面是搜索404时我的网站IIS日志中出现的几条记录:

  2008-07-24 16:05:08 GET /Login.asp - 60.182.153.56 HTTP/1.1 Mozilla/3.0+(compatible;+Indy+Library) - 404 0 1003

  2008-07-24 16:05:08 POST /Login.asp - 60.182.153.56 HTTP/1.1 Mozilla/3.0+(compatible;+Indy+Library) http:-www-sohlg-com /Login.asp 404 0 1003

  2008-07-24 16:05:08 GET /reg.asp - 60.182.153.56 HTTP/1.1 Mozilla/3.0+(compatible;+Indy+Library) http:-www-sohlg-com/Login.asp 404 0 1003

  2008-07-24 16:05:09 POST /reg.asp - 60.182.153.56 HTTP/1.1 Mozilla/3.0+(compatible;+Indy+Library) http:-www-sohlg-com /reg.asp?action=apply 404 0 1003

  相信有经验的站长都明白了吧?这是有人在用一些漏洞扫描工具对网站进行漏洞测试,看看有没有漏洞,使用通用的CMS、DIG、BBS、BLOG系统的站长可要注意了,你所用的网页程序如果有漏洞,网站就会有被黑掉的危险!

  通过IIS日志查找网站是否存在程序错误:

  我们再输入500进行查找,如果查找到相关页面,说明网站 的程序在运行过程中出现了错误,需要对程序进行修改。

  通过IIS日志查找网站是否被入侵过: