如何提取html离线页面的标签下的数据到EXCEL

如何提取html离线页面的标签下的数据到EXCEL,第1张

1、遍历指定文件夹下的所有文件,

2、读取文件源码

3、使用正则批量提取1120和1120LIxxx,将提取的数据写到excel

4、保存结果

================以上过程随便什么语言都能实现,效率不一样而已===========

用JS如何能抓,除非配上反向代理,才能解决JS跨域才能抓。不同域名下,JS是无法访问的。

接口在这里

http://www.thfund.com.cn/calculator.do

POST方式

参数在这 'method=find&date='+d_date+'&fundcode='+c_fundcode,

用PHP的CURL或者JAVA,或者PYTHON的PURL

好吧,它这个貌似GET方式提交也是可行的

http://www.thfund.com.cn/calculator.do?method=find&date=2013-09-12&fundcode=000198


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/7434071.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-05
下一篇 2023-04-05

发表评论

登录后才能评论

评论列表(0条)

保存