Python怎么获取网页中js生成的数据

Python怎么获取网页中js生成的数据,第1张

js代码是需要js引擎运行的,Python只能通过HTTP请求获取到HTML、CSS、JS原始代码而已。

不知道有没有用Python编写差滑的JS引擎,估计需求不大。

我一般用PhantomJS、CasperJS这些引擎来做浏览器抓取。凳粗

直接在其中写JS代枣庆镇码来做DOM *** 控、分析,以文件方式输出结果。

让Python去调用该程序,通过读文件方式获得内容。

第一步:下载了PhantomJS后,把型蚂压缩包里的文件夹解压到D盘,重命名文件夹为phantomjs,然后在windows中添加环境变量D:\phantomjs到Path中。在这竖租敬里先不用关心phantomjs文件夹下的内容。

第二步:接下来我们就要下载CasperJS了,我下载的是version is 1.1-beta3版本。

第三步:下载余慎CasperJS,同样把压缩包里的文件夹解压到D盘,重命名文件夹为casperjs,然后在windows中添加环境变量D:\casperjs\bin到Path中。

第四步:把在运行中运行cmd命令打开控制台,运行命令>casperjs –version,如果可以打印出版本号,恭喜你,CasperJS安装成功。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/tougao/8236600.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-14
下一篇 2023-04-14

发表评论

登录后才能评论

评论列表(0条)

保存