怎么爬取网页的动态内容,很多都是js动态生

怎么爬取网页的动态内容,很多都是js动态生,第1张

抓取动态页面有两种常用的方法,一是通过JavaScript逆向工程获取动态数据接口(真实的访问路径),另一种是利用selenium库模拟真实浏览器,获取JavaScript渲染后的内容。但selenium库用起来比较繁琐,抓取速度相对较慢,所以第一种方法日常使用较多。

1、新建一个html文件,命名为test.html。

2、在test.html文件中,使用script标签加载jquery.min.js文件,成功加载该文件,才能使用jquery方法。

3、在js标签内,在页面加载完成时,获取body对象,使用append()方法向body动态添加一个div元素

4、在test.html文件中,使用button标签创建一个按钮,按钮名称为“获取id值”。

5、在test.html文件中,给button按钮绑定onclick点击事件,当按钮被点击时,执行getid()函数。

6、在js标签内,创建getid()函数,在函数内,通过元素名称获得div对象,使用attr()方法获得动态添加div的id值,并使用alert()方法将值输出。

7、在浏览器打开test.html文件,点击按钮,查看结果。

可以把动态生成的元素的事件委托给固定的父元素(比如$("#selects"))去处理,这样的话不管动态添加多少元素,最终都会把事件冒泡给父元素,父元素再根据target对象获取事件的委托方并作出相应处理。具体请自行百度“事件委托”或“事件代理”。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/bake/11883348.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-19
下一篇 2023-05-19

发表评论

登录后才能评论

评论列表(0条)

保存