Rs2=[] #建立存储分词的列表
for i in range(len(file_object2)):
result=[]
seg_list = jieba.cut(file_object2[i])
for w in seg_list :#读取每一行分词
result.append(w)
Rs2.append(result)#将该行分词写入列表形式的总分词列表
#写入CSV
file=open('D:\Azhongmin2015\python_code\\result2.csv','w')
writer = csv.writer(file)#定义写入格式
writer.writerows(Rs2)#按行写洞梁入
#file.write(str(Rs))
file.close()
在你使用import jieba导入包时,会从sys.path列表中的文件路径中查找,如:衫芹python目录,site-pacakges,系统目录,当前目录等(不一定是这个顺序)site-packages里面放的是第三方包,用安装的方法时,安装包会把对应的文件释放到昌橡site-packages,而手动时一样的意思,耐塌旁把对应的包复制到site-packages即可。
# -*- coding: utf-8 -*-import jieba
import jieba.posseg as pseg
import jieba.analyse
#jieba.load_userdict('userdict.txt')#jieba默认有一个dict.txt词库,但可以根据自己需要加入自己的词条
str1 = "训练一个可进行N维分类的网络的常用方法是使用多项式逻辑回归"
str2 = "可以尝试修改网络架构来准确的复制全连困销唤接模型"
str3 = "模型的目标函数是求交叉熵损失和所有权重衰减项的和,loss()函数的返回值就是这个值"
seg_list = jieba.cut(str1,cut_all =True) #全模式
print("/".join(seg_list))
result = pseg.cut(str1)
result2 = jieba.cut(str2) #精准模式
result3 = jieba.analyse.extract_tags(str3,4) #关键词提取
result4 = jieba.cut_for_search(str3) #搜斗配索引汪凯擎模式
for w in result:
print(w.word,w.flag)
print(" ".join(result2))
print(" ".join(result3))
print(" ".join(result4))
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)