网站小偷程序是怎么做出来的啊?

网站小偷程序是怎么做出来的啊?,第1张

楼上的胡扯!!~~小偷程序运用xml中的xmlhttp组件提供的强大功能,把远程网站上的数据(图片,网页及其他文件)抓取到本地,经过各种处理后显示到页面上或者存储进数据库的一类程序。你可以通过这种小偷程序,完成过去一些似乎完全不可能实现的任务,比如说把某个站的页面偷梁换柱后变成自己的页面,或者把某个站的一些数据(文章,图片)保存到本地数据库中加以利用 关于采集器的制作,其实并不难,就是远程打开要采集的网页,然后用正则表达式将需要的内容匹配出来,只要稍微有点正则表达式的基础,都能做出自己的采集器来的。

小偷程序实际上是通过了XML中的XMLHTTP组件调用其它网站上的网页。

(二)事例

下面就XMLHTTP在ASP中的应用做个简单说明

〈%

'常用函数

'1、输入url目标网页地址,返回值getHTTPPage是目标网页的html代码

function getHTTPPage(url)

dim Http

set Http=server.createobject("MSXML2.XMLHTTP")

Http.open "GET",url,false

Http.send()

if Http.readystate<>4 then

exit function

end if

getHTTPPage=bytesToBSTR(Http.responseBody,"GB2312")

set http=nothing

if err.number<>0 then err.Clear

end function

'2、转换乱玛,直接用xmlhttp调用有中文字符的网页得到的将是乱玛,可以通过adodb.stream组件进行转换

Function BytesToBstr(body,Cset)

dim objstream

set objstream = Server.CreateObject("adodb.stream")

objstream.Type = 1

objstream.Mode =3

objstream.Open

objstream.Write body

objstream.Position = 0

objstream.Type = 2

objstream.Charset = Cset

BytesToBstr = objstream.ReadText

objstream.Close

set objstream = nothing

End Function

'下面试着调用http://www.webjx.com/earticle/的html内容

Dim Url,Html

Url="http://www.webjx.com/earticle/"

Html = getHTTPPage(Url)

Response.write Html

%〉

原理:小偷程序实际上是通过了XML中的XMLHTTP组件调用其它网站上的网页。比如新闻小偷程序,很多都调用了sina的新闻网页,并且对其中的html进行了替换,同时对广告也进行了过滤。小偷程序的优点有:无须维护网站,因为小偷程序中的数据来自其他网站,它将随着该网站的更新而更新;可以节省服务器资源,一般小偷程序就几个文件,所有网页内容都是来自其他网站。缺点有:不稳定,如果目标网站出错,程序也会出错,而且,如果目标网站进行升级维护,那么小偷程序也要进行相应修改;因为是远程调用,速度和在本地服务器上读取数据比起来,肯定要慢一些。

选择万能小偷建站注意事项:一是你的网站使用了独立IP;二是:网站程序位于网站空间根目录;三是:你的网站是新建网站,内容有价值。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/11104847.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-13
下一篇 2023-05-13

发表评论

登录后才能评论

评论列表(0条)

保存