论坛里需要VIP账号才能下载资源,怎么用网络爬虫获取它的下载地址.先给50 ，答对了再加。速度解决_软件运维

现在主流的论坛主要是使用DZ论坛，具有完善的附件管理和权限控制，没有明显的漏洞可以利用，这些文件都是动态通过程序进行下载的，不是你找到了目录就能通过HTTP方式进行下载的。

与其你在这里这么笼统的说要下载，不如说出你想要什么资源，这样说不定可以帮你进行替代资源的查找，特别是程序文档类的，经常不止一个地方有。

Good Luck~

利用python写爬虫程序的方法：

1、先分析网站内容，红色部分即是网站文章内容div。

2、随便打开一个div来看，可以看到，蓝色部分除了一个文章标题以外没有什么有用的信息，而注意红色部分我勾画出的地方，可以知道，它是指向文章的地址的超链接，那么爬虫只要捕捉到这个地址就可以了。

3、接下来在一个问题就是翻页问题，可以看到，这和大多数网站不同，底部没有页数标签，而是查看更多。

4、不过在查看源文件时有一个超链接，经测试它指向下一页，那么通过改变其最后的数值，就可以定位到相应的页数上。

代码如下：

VBA网抓常用方法

1、xmlhttp/winhttp法：

用xmlhttp/winhttp模拟向服务器发送请求，接收服务器返回的数据。

优点：效率高，基本无兼容性问题。

缺点：需要借助如fiddler的工具来模拟http请求。

2、IE/webbrowser法：

创建IE控件或webbrowser控件，结合htmlfile对象的方法和属性，模拟浏览器 *** 作，获取浏览器页面的数据。

优点：这个方法可以模拟大部分的浏览器 *** 作。所见即所得，浏览器能看到的数据就能用代码获取。

缺点：各种d窗相当烦人，兼容性也确实是个很伤脑筋的问题。上传文件在IE里根本无法实现。

3、QueryTables法：

因为它是excel自带，所以勉强也算是一种方法。其实此法和xmlhttp类似，也是GET或POST方式发送请求，然后得到服务器的response返回到单元格内。

优点：excel自带，可以通过录制宏得到代码，处理table很方便

。代码简短，适合快速获取一些存在于源代码的table里的数据。

缺点：无法模拟referer等发包头

也可以利用采集工具进行采集网页端的数据，无需写代码。

欢迎分享，转载请注明来源：内存溢出

论坛里需要VIP账号才能下载资源,怎么用网络爬虫获取它的下载地址.先给50 ，答对了再加。速度解决