(二)握山棚事例
下面就XMLHTTP在ASP中的应用做个简单说明
〈%
'常用函数
'1、输入url目标网页地址,返回值getHTTPPage是目标网页的html代码
function getHTTPPage(url)
dim Http
set Http=server.createobject("MSXML2.XMLHTTP")
Http.open "GET",url,false
Http.send()
if Http.readystate<>4 then
exit function
end if
getHTTPPage=bytesToBSTR(Http.responseBody,"GB2312")
set http=nothing
if err.number<>0 then err.Clear
end function
'2、转换乱玛,直接用xmlhttp调用唯郑有中文字符的网页得到的将是乱玛,可以通过adodb.stream组件进行转换
Function BytesToBstr(body,Cset)
dim objstream
set objstream = Server.CreateObject("adodb.stream")
objstream.Type = 1
objstream.Mode =3
objstream.Open
objstream.Write body
objstream.Position = 0
objstream.Type = 2
objstream.Charset = Cset
BytesToBstr = objstream.ReadText
objstream.Close
set objstream = nothing
End Function
'下面试着调用http://www.webjx.com/earticle/的html内容
Dim Url,Html
Url="http://www.webjx.com/earticle/"
Html = getHTTPPage(Url)
Response.write Html
%〉
楼上的胡扯!!~~小偷程序运用xml中的xmlhttp组件提供伏睁的强大功能,把远程网站上的数据(图片,网页及其他文件缺姿岁)抓取到本地,经过各种处理后显示到页面上或者存储进数据库的一类程序。你可以通过这种小偷程序,完成过去一些似乎完全不可能实现的任务,比如说把某个站的页面偷梁换柱后变册戚成自己的页面,或者把某个站的一些数据(文章,图片)保存到本地数据库中加以利用 关于采集器的制作,其实并不难,就是远程打开要采集的网页,然后用正则表达式将需要的内容匹配出来,只要稍微有点正则表达式的基础,都能做出自己的采集器来的。已经发到你的邮箱,请注意查收,免费版功能就很强大了!
其他人如有需要请同样发知道求助,谢谢!
AMR自动采集系统采用全新程序架构,并具模块化设计,在站点创建及信息采集上提供了极大的方便。程序系统的八大功能给力中国站长:
程序系统支持静态生成,并自动按需更新静态:后台设置静态更新时间,程序系统会根据访客的访问情况自动更新静态,保持和目标站内容一致;只有用户(包括搜索引擎)访问的页面才会被采集,并且生成静态,不会给目标站造成大流量压力;即使目标站宕掉,本站依然正常工作。
可选图片采集,并突破图片防盗链:启用图片采集,可以将目标站所有图片自动采集到本站服务器,有利于搜索引擎优化(此功能可能会占用大量硬盘空间,推荐有独立服务器或VPS用户使用);即使对方有图片防盗链功能,亦可轻松突破。
支持多子域名采集,支持不同域名的图片采集:如果目标站使用了多个二级域名,本站程序系统亦可自动将所有二级域名的站点内容采集过来,形成一个站点。对不同域名的图片,比如淘宝、新浪这样的大型站点,图片和网站使用了不同的域名;本程序亦可将所有图片采集过来,同样突破图片盗链。
可任意修改网页内容/广告:通过替换规则、删除规则、节点规则,可以将网站标题、广告、指定内容替换成。己想要的内容(html代码替换);可以删除不需要的内容;
支持正则表达式替换、删除;支持Xpath语法替换、删除、增加或修改节点元素;
支持站内聚合搜索、自定义创建站内聚合搜索:站内聚合搜索可以搜索站内内容,如果站内不存在的内容,可以自定义搜索数据来源直族键接采集其他网站的数据;并且支持中文分词!通过站内聚合搜索功能,可以自定义N个搜索数据来源,通过自定义显示模板,即可创建聚合搜索引擎、比价网、购物搜索网站。
支持RSS订阅源的自御穗绝定义调用:程序内置了百度风云榜调用规则,可以轻松在网页任何位置显示百度风云榜,并形成站内聚合搜索。
支持代理服务器采集,避免目标站点封IP。
本程序不仅可帮助中小站长完成站点的创建、信息采集,同时可帮动态企业站生成静态,提高企业站安全性。企业站使用本程序,还可以自动采集行业动态补充到自己网站,给企业网站带来自然流量,可以说直接可以取代一个网站编辑的工作镇姿!
正如软件英文名字所说,这款软件就是一个Automatic
Money-making Robot!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)