中英文词云

中英文词云,第1张

中英文词云

安装包:

pip3 install wordcloud matplotlib jieba pillow

WordCloud()可选的参数
font_path:可用于指定字体路径,包括otf和ttf
width:词云的宽度,默认为400
height:词云的高度,默认为200
mask:蒙版,可用于定制词云的形状
min_font_size:最小字号,默认为4
max_font_size:最大字号,默认为词云的高度
max_words:词的最大数量,默认为200
stopwords:将被忽略的停用词,如果不指定则使用默认的停用词词库
background_color:背景颜色,默认为black
mode:默认为RGB模式,如果为RGBA模式且background_color设为None,则背景将透明

使用蒙版
这里讲mask翻译为蒙版,使用蒙版之后,可以根据提供的蒙版图片,生成指定形状的的词云

# _*_ coding:utf-8 _*_
# 使用蒙版
from wordcloud import  WordCloud
from PIL import Image
import numpy as np
import matplotlib.pyplot as plt
import jieba

path = '/Users/ljw/Desktop/'

# 打开文本
text = open(path+'source/xyj.txt',encoding='utf-8').read()

# 中文分词
text = ''.join(jieba.cut(text))
print(text[:100])

# 生成对象
mask = np.array(Image.open(path+"source/black_mask.png"))
wc = WordCloud(mask=mask,font_path='Hiragino.ttf', width=800, height=600, mode='RGBA', background_color=None).generate(text)

# 显示词云
plt.imshow(wc,interpolation='bilinear')
plt.axis('off')
plt.show()

# 保存到文件
wc.to_file(path+"create_images/wordcloud4.png")
    self.font = core.getfont(
OSError: cannot open resource

因为加载字体的文件路径不对造成的!把字体放在同代码文件夹下边即可.

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5658875.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-16
下一篇 2022-12-16

发表评论

登录后才能评论

评论列表(0条)

保存