java提取文本中特定内容

java提取文本中特定内容,第1张

读取文件内容我就不写了一行一行处理

//这个str就是你给的标记文本:

String str = "This/DT talk/NN describes/VBZ the/DT optimal/JJ -LRB-/-LRB- " +

"revenue/NN maximizing/VBG -RRB-/-RRB- auction/NN for/IN sponsored/VBN" +

" search/NN advertising/NN / We/PRP show/VBP that/IN a/DT search/NN " +

"engine/NN 's/POS optimal/JJ reserve/NN price/NN is/VBZ independent/JJ " +

"of/IN the/DT number/NN of/IN bidders/NNS / Using/VBG simulations/NNS , " +

"we/PRP consider/VBP the/DT changes/NNS that/WDT result/VBP from/IN a/DT " +

"search/NN engine/NN 's/POS choice/NN ";

//通过匹配得到String数组

//匹配时被匹配的字符会被自动去除掉(这个就去看看java api String类的方 法"split(regx)")

String strs[] = strsplit("/NN|/JJ");

for (int i = 0; i < strslength; i++) {

//处理数组

String str2 = strs[i]substring(strs[i]lastIndexOf(" "),strs[i]length());

Systemoutprintln(str2);

}

public class Test {

public static void main(String[] args) {

readFileByChars("d://testtxt");

}

public static void readFileByChars(String fileName) {

File file = new File(fileName);

Reader reader = null;

try {

if (file!=null) {

// 一次读多个字符

char[] tempchars = new char[30];

int charread = 0;

reader = new InputStreamReader(new FileInputStream(fileName));

// 读入多个字符到字符数组中,charread为一次读取字符数

while ((charread = readerread(tempchars)) != -1) {

// 同样屏蔽掉\r不显示

if ((charread == tempcharslength)

&& (tempchars[tempcharslength - 1] != '\r')) {

Systemoutprint(tempchars);

} else {

for (int i = 0; i < charread; i++) {

if (tempchars[i] == '\r') {

continue;

} else {

Systemoutprint(tempchars[i]);

}

}

}

}

}

} catch (Exception e1) {

e1printStackTrace();

} finally {

if (reader != null) {

try {

readerclose();

} catch (IOException e1) {

Systemoutprintln("文件不存在");

}

}

}

}

}

先获取全部内容然后再截取。

有两种方法。

String content = "我的名字是,路人甲 ";

contentsplit(",")[0];

contentsubString(0,contentlastIndexOf(","));

上面这两种方法都可以。

我们就以内容是abcde为例:你设置的buf长度是1024,因此每次从文件中读取1024个字符。

第一次读取,frread(buf),因为文件中就5个字符,全被读到了buf中,此时len=5,执行循环体中的语句,输出abcde;然后程序继续执行;

第二次读取,frread(buf),由于文件中的数据第一次已经读完,因此此时返回值为-1,跳出循环。

所以最后输出abcde

获取指定文本框documentgetElementById(“id”)value;

获取所以文本框的类容,可以获取表单form的内容比如input的

documentgetElementById(id)getElementsByTagName("input");

以上就是关于java提取文本中特定内容全部的内容,包括:java提取文本中特定内容、java实现:如何读取一个文本,通过里面的文件路径读取文件内容、java中怎么获取部分文本等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/web/9276548.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-26
下一篇 2023-04-26

发表评论

登录后才能评论

评论列表(0条)

保存