Python程序员是怎么找工作的?怎么最快时间找到自己想要的工作?
前言
从智联招聘爬取相关信息后,我们关心的是如何对内容进行分析,获取用用的信息。
本次以上篇文章“5分钟掌握智联招聘网站爬取并保存到MongoDB数据库”中爬取的数据为基础,分析关键词为“python”的爬取数据的情况,获取包括全国python招聘数量Top10的城市列表以及其他相关信息。
一、主要分析步骤
数据读取
数据整理
对职位数量在全国主要城市的分布情况进行分析
对全国范围内的职位月薪情况进行分析
对该职位招聘岗位要求描述进行词云图分析,获取频率最高的关键字
选取两个城市,分别分析月薪分布情况以及招聘要求的词云图分析
二、具体分析过程
读取数据
结果如图1所示:
2 数据整理
2.1 将str格式的日期变为 datatime
2.2 筛选月薪格式为“XXXX-XXXX”的信息
2.3 分割月薪字段,分别获取月薪的下限值和上限值
将数据信息按职位月薪进行排序
判断爬取的数据是否有重复值
从上述结果可看出,数据是没有重复的。
3 对全国范围内的职位进行分析
3.1 主要城市的招聘职位数量分布情况
对结果进行绘图:
运行结果如下述饼图所示:
3.2 月薪分布情况(全国)
运行结果如下述图所示:
不考虑部分极值后,分析月薪分布情况
运行结果如下述图所示:
3.3 相关技能要求
对获取到的职位招聘要求进行词云图分析,代码如下:
得到结果如下:
4 北京
4.1 月薪分布情况
参考全国分析时的代码,月薪分布情况图如下:
4.2 相关技能要求
词云图如下:
5 长沙
5.1 月薪分布情况
参考全国分析时的代码,月薪分布情况图如下:
5.2 相关技能要求
词云图如下:
之后的也就不一一举例了
相关推荐
susmote 2020-11-07
huavhuahua 2020-11-20
weiiron 2020-11-16
cakecc00 2020-11-15
千锋 2020-11-15
JakobHu 2020-11-14
guangcheng 2020-11-13
xirongxudlut 2020-11-10
solarLan 2020-11-09
pythonxuexi 2020-11-08
文山羊 2020-11-07
wuShiJingZuo 2020-11-05
Pythonjeff远 2020-11-06
jacktangj 2020-11-04
lousir 2020-11-04
YENCSDN 2020-11-17
lsjweiyi 2020-11-17
houmenghu 2020-11-17
Erick 2020-11-17