另外,不知道你所说小偷程序,是不是指用同一程序或者模版修改而来的网站。如果是这种情况的话,可以叫对方把后台给你,因为现在一般的企业站所用的CMS也就那么几类,拿到后台基本就能大概辨认出是不是这些,然后同一建站程序的模版貌似也有查看相同模版的方法(记不太清楚了,我现在只知道Wordpress中有一种方法可以查看到该网站模版的源网站)。
楼上的胡扯!!~~小偷程序运用xml中的xmlhttp组件提供的强大功能,把远程网站上的数据(图片,网页及其他文件)抓取到本地,经过各种处理后显示到页面上或者存储进数据库的一类程序。你可以通过这种小偷程序,完成过去一些似乎完全不可能实现的任务,比如说把某个站的页面偷梁换柱后变成自己的页面,或者把某个站的一些数据(文章,图片)保存到本地数据库中加以利用 关于采集器的制作,其实并不难,就是远程打开要采集的网页,然后用正则表达式将需要的内容匹配出来,只要稍微有点正则表达式的基础,都能做出自己的采集器来的。小偷程序实际上是通过了XML中的XMLHTTP组件调用其它网站上的网页。
(二)事例
下面就XMLHTTP在ASP中的应用做个简单说明
〈%
'常用函数
'1、输入url目标网页地址,返回值getHTTPPage是目标网页的html代码
function getHTTPPage(url)
dim Http
set Http=server.createobject("MSXML2.XMLHTTP")
Http.open "GET",url,false
Http.send()
if Http.readystate<>4 then
exit function
end if
getHTTPPage=bytesToBSTR(Http.responseBody,"GB2312")
set http=nothing
if err.number<>0 then err.Clear
end function
'2、转换乱玛,直接用xmlhttp调用有中文字符的网页得到的将是乱玛,可以通过adodb.stream组件进行转换
Function BytesToBstr(body,Cset)
dim objstream
set objstream = Server.CreateObject("adodb.stream")
objstream.Type = 1
objstream.Mode =3
objstream.Open
objstream.Write body
objstream.Position = 0
objstream.Type = 2
objstream.Charset = Cset
BytesToBstr = objstream.ReadText
objstream.Close
set objstream = nothing
End Function
'下面试着调用http://www.webjx.com/earticle/的html内容
Dim Url,Html
Url="http://www.webjx.com/earticle/"
Html = getHTTPPage(Url)
Response.write Html
%〉
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)