java爬虫怎么动态的获取html

快速成型机 • 2023-4-1 • 随笔 • 阅读 19

很多网站是用js或Jquery 生成数据的，到后台获取到数据以后，用 document.write()或者("#id").html="" 的方式写到页面中，这个时候用浏览器查看源码是看不到数据的。

HttpClient是不行的，看网上说HtmlUnit，说可以获取后台js加载完后的完整页面

不过并没什么用

freemarker没有功能。freemarker要求你自己把东西取出来放到request的attribute里面，然后在ftl文件中使用那些attribute。

可以自己用Java反射来得到实体中字段，然后自己拼html字符串

ArrayList al，获取这张表的信息

定义一个TableName类，TableName tn=new TableName（）

for(int i=0i<al.size()i++){

tn=al.get(i)

<tr>

<td>tn.getname()</td>

.......

</tr>

}

欢迎分享，转载请注明来源：内存溢出

数据后台然后页面爬虫

打赏

微信扫一扫

支付宝扫一扫

上一篇 2023-04-01

下一篇 2023-04-01

登录后才能评论

java爬虫 怎么动态的获取html