怎么使用python中的jieba对csv 文件内容分词后导入TXT中

怎么使用python中的jieba对csv 文件内容分词后导入TXT中,第1张

file_object2=open('D:\A仲敏2015\python_code\\丛慎advice.csv').read().split('\n') #一行行纳郑运的读取内容

Rs2=[] #建立存储分词的列表

for i in range(len(file_object2)):

result=[]

seg_list = jieba.cut(file_object2[i])

for w in seg_list :#读取每一行分词

result.append(w)

Rs2.append(result)#将该行分词写入列表形式的总分词列表

#写入CSV

file=open('D:\Azhongmin2015\python_code\\result2.csv','w')

writer = csv.writer(file)#定义写入格式

writer.writerows(Rs2)#按行写洞梁入

#file.write(str(Rs))

file.close()

在你使用import jieba导入包时,会从sys.path列表中的文件路径中查找,如:衫芹python目录,site-pacakges,系统目录,当前目录等(不一定是这个顺序)

site-packages里面放的是第三方包,用安装的方法时,安装包会把对应的文件释放到昌橡site-packages,而手动时一样的意思,耐塌旁把对应的包复制到site-packages即可。

# -*- coding: utf-8 -*-

import jieba

import jieba.posseg as pseg

import jieba.analyse

#jieba.load_userdict('userdict.txt')#jieba默认有一个dict.txt词库,但可以根据自己需要加入自己的词条

str1 = "训练一个可进行N维分类的网络的常用方法是使用多项式逻辑回归"

str2 = "可以尝试修改网络架构来准确的复制全连困销唤接模型"

str3 = "模型的目标函数是求交叉熵损失和所有权重衰减项的和,loss()函数的返回值就是这个值"

seg_list = jieba.cut(str1,cut_all =True) #全模式

print("/".join(seg_list))

result = pseg.cut(str1)

result2 = jieba.cut(str2) #精准模式

result3 = jieba.analyse.extract_tags(str3,4) #关键词提取

result4 = jieba.cut_for_search(str3) #搜斗配索引汪凯擎模式

for w in result:

print(w.word,w.flag)

print(" ".join(result2))

print(" ".join(result3))

print(" ".join(result4))


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/tougao/12208778.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-21
下一篇 2023-05-21

发表评论

登录后才能评论

评论列表(0条)

保存