这是一个页面嵌套iframe的数据采集,先简单说一下采集原理:
通过你提供的Url定位一个楼盘(这个Url可带参数批量采集),通过解析获取楼盘的详细数据(就是看到的表格数据),这个过程可以通过导航来实现完成,找到iframe中的表格后,获取相应数据前置和后置标志可以采集表格数据(但这种情况意义不大),所以需要根据单元格获取内容的链接地址(即点击后打开的页面),然后在导航到这个页面,采集每个房间的详细信息(房间号、套型、面积等等)。
根据你提供的信息来看,这是一个多层导航的采集,如果需要批量采集,还需带有参数,这个任务配置起来较为复杂一些。
你可以使用的工具:Soukey采摘、网络矿工或网络神采。但好像免费版本都不支持这么复杂的采集案例,需要使用商业版。
用Replace Pioneer可以完成。参看:
>
推荐Replace Pioneer,很容易做到,步骤:
1 准备一个文本文件atxt,需要如下格式:
>
使用网文快捕
下载地址:
>
vba 用MicrosoftXML>
以上就是关于怎么批量采集网站上的数据(方法好的追加100分)全部的内容,包括:怎么批量采集网站上的数据(方法好的追加100分)、如何能在网页中批量提取文子的链接网址、如何批量打开网页等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)