【Python】政府工作报告词云
2019政府工作报告.txt
https://www.lanzous.com/iby44eh
栗子1:
import wordcloud import jieba f=open("2019政府工作报告.txt","r",encoding="utf-8") t=f.read() f.close() ls=jieba.lcut(t) txt=" ".join(ls) w=wordcloud.WordCloud(font_path="msyh.ttc", width=1000,height=700,background_color="white", ) w.generate(txt) w.to_file("2019政府工作报告.png")
结果
可以添加
max_words=15
限制词语数量
栗子2:自定义词云背景样式,背景样式自己找一个图片
代码:
# 分词模块 import jieba # 画图模块 import matplotlib.pyplot as plt # 文字云模块 from wordcloud import WordCloud # 这是一个处理图像的函数,读取背景图片 #from scipy.misc import imread #这句出错imread不用另安装 from matplotlib.pyplot import imread # 词源的文本文件 wf = ‘2019政府工作报告.txt‘ # 读取文件内容 word_content = open(wf,‘r‘, encoding=‘utf-8‘).read().replace(‘\n‘,‘‘) # 设置背景图片 img_file = ‘bj.jpg‘ # 解析背景图片 mask_img = imread(img_file) # 进行分词 word_cut = jieba.cut(word_content) # 把分词用空格连起来 word_cut_join = " ".join(word_cut) # 设置词云参数 wc = WordCloud( #字体 font_path="msyh.ttc", # 允许最大词汇量 max_words = 2000, # 设置最大号字体大小 max_font_size = 90, # 设置使用的背景图片,这个参数不为空时,width和height会被忽略 mask = mask_img, # 设置输出的图片背景色 background_color = ‘white‘ ) # 生成词云 wc.generate(word_cut_join) wc.to_file("2019政府工作报告.png")
结果:
相关推荐
YENCSDN 2020-11-17
lsjweiyi 2020-11-17
houmenghu 2020-11-17
Erick 2020-11-17
HeyShHeyou 2020-11-17
以梦为马不负韶华 2020-10-20
lhtzbj 2020-11-17
夜斗不是神 2020-11-17
pythonjw 2020-11-17
dingwun 2020-11-16
lhxxhl 2020-11-16
坚持是一种品质 2020-11-16
染血白衣 2020-11-16
huavhuahua 2020-11-20
meylovezn 2020-11-20
逍遥友 2020-11-20
weiiron 2020-11-16