对采集的游记进行数据分析
使用jieba模块对内容进行处理,在tfidf.py源码中加入一些自定义的停用词,然后将生成的列表词组使用WordCloud展示出来
from jieba import analyse# 引入TF-IDF关键词抽取接口tfidf = analyse.extract_tags
import matplotlib.pyplot as pltfrom wordcloud import WordCloud,STOPWORDS,ImageColorGeneratorimport jiebafrom scipy.misc import imreadd = os.path.dirname(__file__)font = r‘C:\Windows\Fonts\00CAB71B.007.ttf‘
对游记中出现的地名统计发现:
在地图中的位置如下:
相关推荐
茄肥猫的窝 2020-10-29
kkbb 2020-10-27
gallon00 2020-10-16
yangkang 2020-11-09
lbyd0 2020-11-17
sushuanglei 2020-11-12
85477104 2020-11-17
KANSYOUKYOU 2020-11-16
wushengyong 2020-10-28
lizhengjava 2020-11-13
星月情缘 2020-11-13
huangxiaoyun00 2020-11-13
luyong0 2020-11-08
腾讯soso团队 2020-11-06
Apsaravod 2020-11-05
PeterChangyb 2020-11-05
gaobudong 2020-11-04
wwwjun 2020-11-02