求大神写java一个小程序,对已经分词好的中文文档,提取出现频率最高的前N个词汇及显示出现次数~

求大神写java一个小程序,对已经分词好的中文文档,提取出现频率最高的前N个词汇及显示出现次数~,第1张

下面的是写的一段测试代码,结果如图:

至于你要的前N个词汇出现频率最高的,就不帮你写了,提示可以使用 List<String,int>去计算。

import java.util.ArrayList

import java.util.List

public class Test {

String content = "虽然/c 宝洁/nz 的/ude1 整体/n业务/n发展/vn"

+ " 状况/n 仍/d为/v 增长/vn,/wd 但/c 在/p 一些/mq领域/n "

+ "受到/v 强大/a的 / ude1 竞争/vn 压力/n 影响/vn 。/wj比如/v"

+ " 在禅链/p 传统/n的早升/ ude1 洗/v 发/v 水/n、/wn 洗衣粉/n、/wn "

+ "护理/vn 用品/n等/ udeng日常/b护理/vn领域/n,/wd宝洁/nz" +

" 在/p 全球/n 范"

public void start() {

String newContent=content.replaceAll("[\\s]","")//去陆袭老掉空格

String[] words = newContent.split("[\\/]")// 分割出带字母的词汇

List<String>list = new ArrayList<String>()

for (int i = 0i <words.lengthi++) {

char[] bytes = words[i].toCharArray()

String xx = ""

for (int j = 0j <bytes.lengthj++) {

String bt = bytes[j] + ""

if (!bt.matches("[a-zA-Z]") &&!bt.matches("[0-9]")

&&!bt.matches("[,。?、]")) {

xx += bt

}

}

list.add(xx)// 得到所有中文词汇

}

for (int i = 0i <list.size()i++) {

String w = list.get(i).toString()

if (!"".contains(w)) {

int count = 0

for (int j = 0j <list.size()j++) {

if (w.equals(list.get(j))) {

count++

}

}

System.out.println("词汇《" + w + "》出现了 " + count + "次 !")

}

}

}

public static void main(String args[]) {

new Test().start()

}

}

目前中国的燃粗航空公司每个公司每周还有一班飞机飞澳洲航线。你需要先买好机票,然后查看大使馆网站上的入境须知。在登机前三天做核酸检测,然后下载APP,用阴性检验结果申请健康码。有了健康码就可以登机了。回国以后自携段衡费在酒店隔离十四天,你的回国辩做之旅就算完成了。

女织男耕

拼音:nǚ zhī nán gēng简拼:nzng

近义词:反义词:

用法:

解释:〖解释〗封建社会中的小农搭嫌经济,一家一户经营,男的种田,女的织布。指全家分工劳动。

出处:〖出处〗宋·罗泌基枝兄《路史·后纪十二·夏后氏》:“男耕女织,不夺其时。”

例子:〖示例〗~,桑麻满圃。 ★明·赵弼《青城搏袭隐者记》

谒后语:

谜语:


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/12538069.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-26
下一篇 2023-05-26

发表评论

登录后才能评论

评论列表(0条)

保存