是指用XMLHTTP实现获取其他网站的HTML代码
具体的你可以上网搜一下XMLHTTP教程
比如我做一个页面获取sina的首页代码,每次打开这个页面都从新获取,所以就随着sina的更新而更新
它的弊端就是速度比较慢
偷网页需要指定深度级别。如果你只偷了一级页面,那页面上的链接所指向的内容很有可能是原站的。点了以后就回原站了。
一般情况下,会进行三级深度的扫描。
扫描完一个页面后,将页面上的所有图片,JS等内容下载到本地指定的路径里,将扫描完的页面代码中的资源路径进行替换。
然后进入二级页面,继续上一步的 *** 作。不同的是,将页面内容存下来后,将上级页面中的链接指向该页面。
这样就完整了。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)