您好,这样的:
解析HTML文档的Java程序
下面是一个解析HTML字符串,网络上下载的HTML文件,以及本地文件系统中的HTML文件的完整的Java程序。你可以使用Eclipse IDE或者别的IDE甚至命令来运行这个程序。在Eclipse里面则很简单,拷贝这份代码,新建一个Java工程,在src包上右键并粘贴进去就可以了。Eclipse会去创建正确的包及同名的Java源文件的,因此工作量最小。如果你已经有一个Java示例工程了,那么仅需一步就可以了。下面的这个Java程序展示了解析及遍历HTML文件的三个不同例子。第一个例子中,我们直接解析了一个内容为HTML的字符串,第二个例子中我们解析了一个从URL中下载的HTML文件,第三个中我们从本地文件系统中加载了一个HTML文档并进行解析。第一和第三个例子中都用到了parse方法来获取一个Document对象,你可以查询它来提取出任何的标签值或者属性值。第二个例子中,我们用到了Jsoupconnect方法,它会去创建URL的连接,下载HTML并进行解析。这个方法也会返回Document,它可以用于后续的查询及获取标签或者属性的值。
import javaioIOException;
import orgjsoupJsoup;
import orgjsoupnodesDocument;
import orgjsoupnodesElement;
/
[] Java Program to parse/read HTML documents from File using Jsoup library
[] Jsoup is an open source library which allows Java developer to parse HTML
[] files and extract elements, manipulate data, change style using DOM, CSS and
[] JQuery like method
[]
[] @author Javin Paul
[]/
public class HTMLParser{
public static void main(String args[]) {
// Parse HTML String using JSoup library
String HTMLSTring = "<!DOCTYPE html>"
+ "<html>"
+ "<head>"
+ "<title>JSoup Example</title>"
+ "</head>"
+ "<body>"
+ "|[b]HelloWorld[/b]"
+ ""
+ "</body>"
+ "</html>";
Document html = Jsoupparse(HTMLSTring);
String title = htmltitle();
String h1 = htmlbody()getElementsByTag("h1")text();
Systemoutprintln("Input HTML String to JSoup :" + HTMLSTring);
Systemoutprintln("After parsing, Title : " + title);
Systemoutprintln("Afte parsing, Heading : " + h1);
// JSoup Example 2 - Reading HTML page from URL
Document doc;
try {
doc = Jsoupconnect("><input type="file" name="image" id="image" accept="jpg">
这个属性是html5规定的,因此浏览器必须兼容或支持html5,比如ie10+, chrome, firefox等。
别忘记在网页开头写上<!doctype html>以声明支持html5。
html中的控件一般都只是提供一个功能,具体的逻辑细节需要自己写的,比如你可以在控件上加一个required属性,这样文件上传控件为空的时候就不能上传了,或者你也可以用js判断这个文件域为空的时候也不让上传也是同理的。
assoc html=htmlfile
ftype htmlfile="C:\Program Files\internet explorer\iexploreexe" "%1"
通过 CreateObject 函数创建后的 htmlfile 对象不支持对其属性的调用,
而添加 Microsoft HTML Object Library 这个引用后是可以的。
一个html文件只能被dreamweaver应用程序打开编辑是不对的。html文件是一种纯文本文件,可以用任何文本处理软件来创建和处理HTML,html是超文本标记语言文件文档,是扩展名为html的文件,由HTML命令组成的描述性文本,HTML命令可以说明文字、图形、动画、声音、表格、链接等,HTML文件是可以被多种网页浏览器读取,传递各类资讯的文件,HTML文件会被存储在分布于世界各地的服务器硬盘上,通过传输协议用户可以远程获取这些文件所传达的资讯和信息。
以上就是关于java中.html文件和.java文件的用途及运行环境全部的内容,包括:java中.html文件和.java文件的用途及运行环境、html file设置文件类型、html file 怎么获取file选择的文件等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)