摘要:网页撷取(1) 利用WebClIEnt
01 using ...System.Net;
02 using System.IO;
03 using System.Text;
04
05 public voID _WebClIEnt(string url)
06 ????????...{
07 ????????????WebClIEnt wc = new WebClIEnt();
08
09???????????? // 依照默认值,WebClIEnt 执行个体并不会传送选择性的 http 标头。
10 ????????????// 如果您的要求需要有选择性的标头,您就必须将标头加入至 headers??集合中。
11 ????????????// 例如,若要在响应中保留查询,您就必须加入使用者代理程序 (User-Agent) 的标头。
12 ????????????// 同时,如果遗失使用者代理程序标头,则服务器可能返回 500 (内部服务器错误)。
13 ????????????wc.headers.Add("user-agent","Mozilla/4.0 (compatible; MSIE 6.0; windows NT 5.2; .NET CLR 1.0.3705;)");
14
15???????????? // 表示支持压缩,也就是说,你可以丢压缩过的数据过来
16 ????????????// wc.headers.Add("Accept-EnCoding","gzip,deflate");
17
18???????????? Stream data = wc.OpenRead(url);
19
20???????????? //要知道正确的编码,再去读取! StreamReader 默认值为 UTF-8 编码方式
21
22???????????? //StreamReader reader = new StreamReader(data,EnCoding.GetEnCoding("gb2312"));//简体
23 ????????????
24 ????????????StreamReader reader = new StreamReader(data);????????????
25 ????????????string s = reader.ReadToEnd();
26
27??????????? ?? data.Close();
28 ????????????reader.Close();
29
30 ????????}
31
==============================================================
参考:
http://blog.roodo.com/thinkingmore/archives/2782355.HTML
http://msdn.microsoft.com/zh-tw/library/system.net.webclIEnt%28VS.80%29.aspx
原文:大专栏 网页撷取(1) 利用WebClient
总结以上是内存溢出为你收集整理的网页撷取(1) 利用WebClient全部内容,希望文章能够帮你解决网页撷取(1) 利用WebClient所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)