java程序怎么读取html网页?

java程序怎么读取html网页?,第1张

步骤:

一、使用java.net包下的URL类,可以将一个网页(链接)封装成一个URL对象

二、URL对象有一个openStream()方法,使用该方法可以获取该网页的输入流,我们可以通过读取输入流的方式获得网页的内容,并通过输出流写入HTML文件中。

补充:

步骤:

1.通过URL对象的openStream()方法获得网页的字节输入流 。

2.为字节输入流加缓冲 。

3. 创建字节输出流对象 。

4. 为字节输出流加缓冲 。

5. 读取数据,并写入HTML文件 。

给你一个思路,可能不是最好的,但可以解决这个问题,把这段html当成xml解析,然后以键值对的形式放到map里去,标签就作为键,标签里的内容就作为值,多个相同的标签名称比如span,可以这样命名当作键span、 span2、 span3、 span4。比如你要取时间的值就直接map.get("span2")就可以拿到了。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/6166381.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-17
下一篇 2023-03-17

发表评论

登录后才能评论

评论列表(0条)

保存