java爬虫 怎么动态的获取html

java爬虫 怎么动态的获取html,第1张

很多网站是用js或Jquery 生成数据的,到后台获取到数据以后,用 document.write()或者("#id").html="" 的方式 写到页面中,这个时候用浏览器查看源码是看不到数据的。

HttpClient是不行的,看网上说HtmlUnit,说 可以获取后台js加载完后的完整页面

不过并没什么用

首先,学习难度,技术方面,入门简单的,大概是前端,也就是你说的html,这也不算枯燥,但是,只是入门简单,学习难度之后进阶会越来越难,需要一直学习,发展速度快,一不学习很有可能就失业了。

其次,Java吧,入门相对容易,当然要做到能够工作的程度,都是需要一定的深入学习的,学习难度都随着需要肯定会越来越难,内容也也来越多,稳定的前提是你的能力能够胜任你所在的职位,没有特别简单的,另外不枯燥的话,只要热爱,做什么都不枯燥的。

网上经常有人说到了大数据和云计算,还有虚拟现实,人工智能可能是近几年十分火的,但是学起来也不是那么容易,工资倒是高,但是还是和能力成正比。

最后,编程语言还是推荐Java,毕竟用到的地方挺多的,准备培训的话,来我们这看看。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/7057586.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-01
下一篇 2023-04-01

发表评论

登录后才能评论

评论列表(0条)

保存