用java写一个网页输入url点击查询即可在下面显示网页源代码

用java写一个网页输入url点击查询即可在下面显示网页源代码,第1张

import javaio;

import javanet;

public class Demo {

    public static void main(String[] args) throws Exception {

        BufferedReader br = new BufferedReader(new InputStreamReader(Systemin));

        Systemoutprintln("请输入要显示源码的地址:");

        URL url = new URL(brreadLine());

        URLConnection conn = urlopenConnection();

        InputStream is = conngetInputStream();

        byte[] b = new byte[1024];

        int len = 0;

        while((len = isread(b))!=-1){

            Systemoutprintln(new String(b,0,len,"UTF-8"));

        }

    }

}

//下班,控制台的,网页的你稍微修改一下就OK啦。

用下这个试试,这是我以前写暴力破解时用的

String ipd=new String(">

根据java网络编程相关的内容,使用jdk提供的相关类可以得到url对应网页的html页面代码。

针对得到的html代码,通过使用正则表达式即可得到我们想要的内容。

比如,我们如果想得到一个网页上所有包括“java”关键字的文本内容,就可以逐行对网页代码进行正则表达式的匹配。最后达到去除html标签和不相关的内容,只得到包括“java”这个关键字的内容的效果。

URL url = new URL(">

htmlparser是一个纯的java写的html解析的库,它不依赖于其它的java库文件,主要用于改造或

提取html。它能超高速解析html,而且不会出错。现在htmlparser最新版本为20。

毫不夸张地说,htmlparser就是目前最好的html解析和分析的工具。

无论你是想抓取网页数据还是改造html的内容,用了htmlparser绝对会忍不住称赞。

jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的 *** 作方法来取出和 *** 作数据。

以上就是关于用java写一个网页输入url点击查询即可在下面显示网页源代码全部的内容,包括:用java写一个网页输入url点击查询即可在下面显示网页源代码、为什么我用java取页面源代码时,会报这个错呢应该怎么改呢、请大家帮帮忙. 使用java爬虫得到网页以后怎么提取里面自己需要的内容呢如果会代码请您写一下.谢谢您等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/web/9558735.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-29
下一篇 2023-04-29

发表评论

登录后才能评论

评论列表(0条)

保存