新手如何简单的分析网站日志

新手如何简单的分析网站日志,第1张

这要在服务器上安装来访源记录的相关服务器软件来实现了,不过通常能查看出谁来修改过的时间以及退出的时间,要想完全记录每一个修改人的修改全部信息您需要IIS创建上传下载来完成了,因为每修改一次都需要记录档那也就是说都需要另建一份新文件的,也就是说您访问了,保存了10此,那么服务器内实际上也就产生了10个档案文件。不可能为单一文件来实现了,因为那考验的是EXCEL的功能,而不是网络服务器设置的功能,这个您要去询问OFFICE开放商来完成的,目前尚未实现此功能。

一个合格的站长或者seoer必须要能看懂网站的服务器日志文件,这个日志记录了网站被搜索引擎爬取的痕迹,给站长提供了蜘蛛是否来访的有力佐证,站长朋友可以通过网站日志来分析搜索引擎蜘蛛的抓取情况,分析网站的是否存在收录异常问题。并且我们可以根据这个日志文件判断蜘蛛来访频率以及抓取规律,这将非常有利于我们做优化。另外,学习分析网站日志文件也是站长必须具备的能力,也是你从一个初级seo进阶到seo高手的必由之路。但是前提是要主机服务商开通日志统计功能,一般虚拟主机提供商都不会开通,你可以申请开通,或者自己到服务器管理后台开通这个日志统计功能,不过日志也会占用空间的,我们在看完日志文件后,可以隔段时间清理下日志文件。那么如何分析服务器日志文件呢听我娓娓道来。
搜索引擎抓取网站信息必会在服务器上留下信息,这个信息就在网站日志文件里。我们通过日志可以了解搜索引擎的访问情况,一般通过主机服务商开通日志功能,再通过FTP访问网站的根目录,在根目录下可以看到一个log或者weblog文件夹,这里面就是日志文件,我们把这个日志文件下载下来,用记事本(或浏览器)打开就可以看到网站日志的内容。那么到底这个日志里面隐藏了什么玄机呢其实日志文件就像飞机上的黑匣子。我们可以通过这个日志了解很多信息,那么到底这个日志给我们传递了什么内容呢
如果想要知道网站日志文件包含了什么内容,首先必须知道各搜索引擎的蜘蛛名称,比如百度的蜘蛛程序名称是baiduspider,Google的机器人程序名称是Google-Googlebot等等,我们在日志的内容里搜索上述的的蜘蛛名就可以知道哪个搜索引擎已经爬取过网站了,这里就留下了他们的蛛丝马迹。再者,必须能看懂常见的>

利用Windows2003服务器的远程维护功能,并通过IE浏览界面,就能对服务器的日志文件进行远程查看了,不过默认状态下,Windows2003服务器的远程维护功能并没有开通,需要手工启动。

查看服务器日志文件的作用

网站服务器日志记录了web服务器接收处理请求以及运行时错误等各种原始信息。通过对日志进行统计、分析、综合,就能有效地掌握服务器的运行状况,发现和排除错误原因、了解客户访问分布等,更好的加强系统的维护和管理。

对于自己有服务器的朋友或是有条件可以看到服务器日志文件的朋友来说,无疑是了解搜索引擎工作原理和搜索引擎对网页抓取频率的最佳途径。

通过这个文件,您可以了解什么搜索引擎、什么时间、抓取了哪些页面,以及可以知道是主搜索蜘蛛还是从搜索蜘蛛抓取了您的网站等的信息。

访问原理

1、客户端(浏览器)和Web服务器建立TCP连接,连接建立以后,向Web服务器发出访问请求(如:Get),根据>

2、Web服务器收到请求后,将客户端要求的页面内容返回到客户端。如果出现错误,那么返回错误代码。

3、服务器端将访问信息和错误信息纪录到日志文件里。

下面我们就对本公司自己服务器其中的一个日志文件进行分析。由于文件比较长,所以我们只拿出典型的几种情况来说明。

1、首先我们可以通过快捷搜索功能快速找到对应的web日志,获得服务器的日志,把日志文件直接拖入到表格文件里面会自动适配。
2、其次黑客在黑入服务器时会对服务器进行漏洞扫描,会产生大量的404状态,我们通过观察404状态码的时间和路径还原攻击时间和路径。
3、最后找出大量的404反馈的问题ip,我们将有有问题的ip在搜素功能内进行搜索,反馈出的这些路径都是黑客成功进入的文件,将这些文件下载下来,与被攻击前的文件进行对比,将有问题的代码找出来并进行剔除即可。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/10513826.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-09
下一篇 2023-05-09

发表评论

登录后才能评论

评论列表(0条)

保存