在python 环境下,使用结巴分词,自动导入文本,分词,提取关键词.脚本 大侠给个

在python 环境下,使用结巴分词,自动导入文本,分词,提取关键词.脚本 大侠给个,第1张

# -- coding: utf-8 --

import jieba

import jiebaposseg as pseg

import jiebaanalyse

#jiebaload_userdict('userdicttxt')#jieba默认有一个dicttxt词库,但可以根据自己需要加入自己的词条

str1 = "训练一个可进行N维分类的网络的常用方法是使用多项式逻辑回归"

str2 = "可以尝试修改网络架构来准确的复制全连接模型"

str3 = "模型的目标函数是求交叉熵损失和所有权重衰减项的和,loss()函数的返回值就是这个值"

seg_list = jiebacut(str1,cut_all =True) #全模式

print("/"join(seg_list))

result = psegcut(str1)

result2 = jiebacut(str2) #精准模式

result3 = jiebaanalyseextract_tags(str3,4) #关键词提取

result4 = jiebacut_for_search(str3) #搜索引擎模式

for w in result:

print(wword,wflag)

print(" "join(result2))

print(" "join(result3))

print(" "join(result4))

版本 2

程序集 窗口程序集_启动窗口

子程序 _按钮1_被单击

局部变量 文本行, 整数型

局部变量 文本, 文本型

文本 = 编辑框1内容

文本行 = 文本_取文本所在行 (文本, “ccc”)

编辑框2内容 = 文本_取指定变量文本行 (文本, 文本行 + 1)

子程序 文本_取指定变量文本行, 文本型, 公开, 成功返回指定的文本行文本,失败返回空文本。

参数 文本, 文本型

参数 行号, 整数型

局部变量 文本数组, 文本型, , "0"

文本数组 = 分割文本 (文本, #换行符, )

如果真 (行号 ≤ 0)

    返回 (“”)

如果真结束

如果真 (行号 > 取数组成员数 (文本数组))

    返回 (“”)

如果真结束

返回 (文本数组 [行号])

子程序 文本_取文本所在行, 整数型, 公开, 查找某段字或关键中在文本中的哪一行出现,成功返回行数,失败返回0

参数 源文本, 文本型

参数 欲查找的文本, 文本型

参数 是否区分大小写, 逻辑型, 可空

局部变量 局_文本, 文本型, , "0"

局部变量 局_计次, 整数型

局_文本 = 分割文本 (源文本, #换行符, )

计次循环首 (取数组成员数 (局_文本), 局_计次)

    如果真 (寻找文本 (局_文本 [局_计次], 欲查找的文本, , 取反 (是否区分大小写)) ≠ -1)

        返回 (局_计次)

    如果真结束

计次循环尾 ()

返回 (0)

希望对你有帮助

1、这两个是不同的cms系统

2、当然可能功能上有所不同

3、如果确实帝国系统后台没有类似功能那就没办法了

4、要吗找人二次开发,要吗换用dedecms系统

多素材织梦模板

为您解答

望采纳

以上就是关于在python 环境下,使用结巴分词,自动导入文本,分词,提取关键词.脚本 大侠给个全部的内容,包括:在python 环境下,使用结巴分词,自动导入文本,分词,提取关键词.脚本 大侠给个、易语言,怎么从txt文本中搜索到指定关键词!然后自动获取下一行的信息!、帝国内容页关键词应该怎么没有DEDE那样的自动提取等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/web/9495203.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-28
下一篇 2023-04-28

发表评论

登录后才能评论

评论列表(0条)

保存