Google让蜘蛛自动填表提交 以抓取更多网页

Google让蜘蛛自动填表提交 以抓取更多网页,第1张

Google让蜘蛛自动填表提交以抓取更多网页

据海外新闻媒体报道:英国搜索巨头谷歌公司(GoogleInc.)最近刚刚开始在网页抓取搜索引擎蜘蛛中实现一项新技术应用:他们可以让搜索引擎蜘蛛自动填写网页中的一些表格,并自动提交给服务器,抓取反馈网页,然后获得这个网站的大量详细信息。

媒体分析,这将对网站的网络信息安全构成威胁。

一般来说,表单是一种用于在网站层面收集客户信息的方法。比如客户申请会员注册,必须提交相关真实身份材料。表单会将这些数据信息提交给服务器,服务器上的网页会得到下一个提醒。

以前谷歌的蜘蛛机器人是不填表的,因为它无法知道下一个提醒页面。

最近,谷歌升级了抓取系统的软件。智能机器人会根据表单中每个新条目的名称自动填写数据信息并提交给服务器,这样服务器的反馈网页也会被智能机器人抓取,Google会得到这个网站的其他信息。

谷歌在博客中表示,他们将对这一角色持谨慎态度。比如一开始一些非常有效的网站会自动选择填表方式。另外,系统管理员可以在robots.txt文件中询问是否允许谷歌提交表单,谷歌不容易违背系统管理员的意图。

检索领域的权威专家表示,谷歌的这一角色将对官网的网络信息安全构成威胁。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/762684.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-01
下一篇 2022-05-01

发表评论

登录后才能评论

评论列表(0条)

保存