Java中怎样用正则表达式获取metal标签里content里的内容

Java中怎样用正则表达式获取metal标签里content里的内容,第1张

如果要用正则的话,

String re = "content=[\\"']([^\\"'>]+)[\\"']";

String str = "<meta name=\"keywords\" content=\"这里是想要的内容 \" />"+

"<meta content=\"这里是想要的内容 \"  name=\"keywords\" />"+

"<meta content='这里是想要的内容'  name='keywords' >"+

"<meta   name=keywords  content=这里是想要的内容>";

 

Pattern p = Patterncompile(re);

Matcher m = pmatcher(str);

// Read the docs on how to use the matcher object

代码很简单,一看就能看懂:

import javautilregexMatcher;

import javautilregexPattern;

public class Test {

public static void main(String[] args) {

Pattern p = Patterncompile("(<=<td>)(=</td>)");

String str ="<td>20分钟</td>";

Matcher m = pmatcher(str);

while(mfind())

Systemoutprintln(mgroup());

}

}

可以使用Jsoup解析器

jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的 *** 作方法来取出和 *** 作数据。

示例

<html>

    <title>hello</title>

  <head>

  </head>

  

  <body>

   <form action="/FileUpload/Upload" method="post" enctype="multipart/form-data">

   <input name="name"/><br/>

   <input type="file" name="head"/><br/>

   <input type="submit" value="upload"/>

   </form>

  </body>

</html>

比如要取得上面html中的标题

这样使用Jsoup

    Document doc = Jsoupparse(html);//html为内容    

    Element e_title = docgetElementsByTag("title")get(0);//根据标签名找title元素

    String title = e_titletext();//获取标签的文字

获取form中的method值

Document doc = Jsoupparse("s");

Element e_form = docgetElementsByTag("form")get(0);

String method = e_formattr("method");

可以说使用非常简单,几行代码就能搞定。

如果你的文本严格就是那种格式的 那么

String regex = "<text>(+)</text><text>(+)</text>";

试试这个

1、html标签 获取java的值 用 <%=xxx%>

2、java获取script中的值:

script中 通过get post请求 提交到服务端,然后服务端java可取到

可以分成两步

Step1

找出div中的所有标签

(s)<div[^>]+>(+)</div>(-s)

其中分组1为div标签中内容

step2

在Step1中找出的内容中,查找a标签

(s)<a[^>]+href="([^"]+)"[^>]>([^<]+)</a>(s)

其中分组1为超链接的地址,分组2为超链接显示的内容

XML文件的表现:以“xml”为文件扩展名的文件;

存储结构:树形结构;

节点名称区分大小写。

1、<book id="1"></book> id为属性, <book><id>1</id></book> id为节点

2、xml文件开头要加上版本信息和编码方式<xml version="10" encoding="UTF-8">

比如:

❤ 为什么要使用XML?

思考1:不同应用程序之间的通信?

思考2:不同平台间的通信?

思考3:不同平台间的数据共享?

答案就是我们要学习的XML文件。我们可以使用相同的xml把不同的文件联系起来

回到顶部

二、应用 DOM 方式解析 XML

❤ 在Java程序中如何获取XML文件的内容

解析的目的:获取节点名、节点值、属性名、属性值;

四种解析方式:DOM、SAX、DOM4J、JDOM

DOM、SAX :java 官方方式,不需要下载jar包

DOM4J、JDOM :第三方,需要网上下载jar包

示例:解析XML文件,目标是解析XML文件后,Java程序能够得到xml文件的所有数据

思考:如何在Java程序中保留xml数据的结构?

如何保留节点之间的层级关系?

注意常用的节点类型:

下面介绍DOM方式解析XML:

功能说明:

以上就是关于Java中怎样用正则表达式获取metal标签里content里的内容全部的内容,包括:Java中怎样用正则表达式获取metal标签里content里的内容、如何使用java正则表达式提取网页中标签里的内容,比如如何提取<td>20分钟</td>里的20分钟,请求高手帮助、java 中截取<></>类似标签中的字符串的方法等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/web/10144320.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-05
下一篇 2023-05-05

发表评论

登录后才能评论

评论列表(0条)

保存