java爬虫怎么动态的获取html_随笔

很多网站是用js或Jquery 生成数据的，到后台获取到数据以后，用 document.write()或者("#id").html="" 的方式写到页面中，这个时候用浏览器查看源码是看不到数据的。

HttpClient是不行的，看网上说HtmlUnit，说可以获取后台js加载完后的完整页面

不过并没什么用

首先，学习难度，技术方面，入门简单的，大概是前端，也就是你说的html，这也不算枯燥，但是，只是入门简单，学习难度之后进阶会越来越难，需要一直学习，发展速度快，一不学习很有可能就失业了。

其次，Java吧，入门相对容易，当然要做到能够工作的程度，都是需要一定的深入学习的，学习难度都随着需要肯定会越来越难，内容也也来越多，稳定的前提是你的能力能够胜任你所在的职位，没有特别简单的，另外不枯燥的话，只要热爱，做什么都不枯燥的。

网上经常有人说到了大数据和云计算，还有虚拟现实，人工智能可能是近几年十分火的，但是学起来也不是那么容易，工资倒是高，但是还是和能力成正比。

最后，编程语言还是推荐Java，毕竟用到的地方挺多的，准备培训的话，来我们这看看。

欢迎分享，转载请注明来源：内存溢出

java爬虫怎么动态的获取html