java爬虫 怎么动态的获取html

java爬虫 怎么动态的获取html,第1张

很多网站是用js或Jquery 生成数据的,到后台获取到数据以后,用 document.write()或者("#id").html="" 的方式 写到页面中,这个时候用浏览器查看源码是看不到数据的。

HttpClient是不行的,看网上说HtmlUnit,说 可以获取后台js加载完后的完整页面

不过并没什么用

freemarker没有功能。freemarker要求你自己把东西取出来放到request的attribute里面,然后在ftl文件中使用那些attribute。

可以自己用Java反射来得到实体中字段,然后自己拼html字符串

ArrayList al,获取这张表的信息

定义一个TableName类,TableName tn=new TableName()

<%

for(int i=0i<al.size()i++){

tn=al.get(i)

%>

<tr>

<td>tn.getname()</td>

.......

</tr>

<%

}

%>


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/7062176.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-01
下一篇 2023-04-01

发表评论

登录后才能评论

评论列表(0条)

保存