生成开端原著小说词云
今天刚好看了开端,然后又学了一点Python,于是灵光一闪,想到用新学的wordcloud生成一下小说的词云会怎么样。
代码如下
import jieba import wordcloud f = open("开端.txt", "r", encoding="utf-8") t = f.read()#一次性读入 f.close() ls = jieba.lcut(t)#返回分词结果,一个列表 newls=[]#建一个新列表 for word in ls: if len(word)>1: newls.append(word)#新列表去掉了单个字 txt = " ".join(newls)#用空格把列表里的元素连成长字符串 w = wordcloud.WordCloud(width = 1000, height = 700,background_color = "white",font_path = "/System/Library/Fonts/Supplemental/Songti.ttc")#中文词云得指定一下字体别忘了 w.generate(txt)#加载文本 w.to_file("开端词云.png")
结果如下
女主的姓没了,笑死,可能是分词分出去了给砍掉了。
没有去掉一些“什么”“这样”“已经”之类的虚词,看起来有点奇怪,不过无所谓了。第一次用Python玩自己想玩的小玩意,也挺开心。
开端看到第10集了,下周接着看,希望能看到一个完美的结局!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)