2、第二种是使用外部工具,若你 Linux 下编程,可以在程序中调用 wget 命令,将请求的 URL 传入 wget 做为参数,并将返回的结果输出到一个指定的文件,然后去读取这个文件,分析返回的 HTML 源码即可;
3、第三种是使用 HTTP 库,比如 libcurl 库,网上有使用方法,使用起来很简单,推荐使用这种方法。
模拟浏览器行为,按照http协议像服务器发送请求,解析服务器返回内容,根据需要决定是否继续发送请求(比如获取该页面某个链接的内容?),如果遇到js只流,那你还要写个东东来解析js。。总之,简单应用可以,复杂应用免谈。
Google之流的技术不是我们小作坊能比拟的。
百度cprops,这是一个c写的http库
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)