Scrapy爬取智联招聘

heyboz

2019-07-01

之前接了一个活，做的功能是从智联招聘爬取招聘信息
赚了几百块零花钱
实现了一个GUI，如图：
Scrapy爬取智联招聘
虽然比较丑low，但是简洁明了，落落大方（已经是我水平的天花板了）
具体功能说明就不了，大家都能看懂的。。。。
智联招聘链接

网页是这个样子的，反爬虫不强。
还实现了一个功能，就是定时发送邮件
如图：
Scrapy爬取智联招聘
具体功能说明就不了，大家都能看懂的。。。。
接下来就要开源代码了，本来想上传文件，但是发现思否不支持（好像其他博客也不行。。。。。）
所以准备发到github上了。
Github链接呢

顺便说一下思路：
网页参数jl是控制地区的

#下拉列表(地区)
area={
    '全国': 489,
    '北京': 530,
    '上海': 538,
    '深圳': 765,
    '广州': 763,
    '天津': 531,
    '成都': 801,
    '杭州': 653,
    '武汉': 736,
    '大连': 600,
    '南京': 635,
    '苏州': 639,
    '西安': 854,
}

kw参数就是搜索关键词
https://sou.zhaopin.com/?jl=6...
Scrapy爬取智联招聘
def start_requests(self):发送请求
def parse(self, response):解析列表，发送子请求（为了获取详情）
def re_parse(self, response):解析具体内容

最后，网页时动态渲染的，所以在middleware加了一个selenium，毕竟scrapy本身不支持动态渲染。但这也破坏了scrapy的异步结构，所以，速度不是很理想，但够用。

详情的话，具体看代码吧。乏了。

scrapy segmentfault

安科网

Scrapy爬取智联招聘

heyboz

heyboz

相关推荐

Scrapy项目实战：爬取某社区用户详情

如何利用Scrapy爬虫框架抓取网页全部文章信息（上篇）

一分钟搞定Scrapy分布式爬虫、队列和布隆过滤器

一篇文章教会你理解Scrapy网络爬虫框架的工作原理和数据采集过程

在Scrapy中如何利用Xpath选择器从网页中采集目标数据——详细教程（下篇）

在Scrapy中如何利用Xpath选择器从网页中采集目标数据——详细教程（上篇）

手把手教你进行Scrapy中item类的实例化操作

如何改造 Scrapy 从而实现多网站大规模爬取？

二十六、Scrapy自定义命令

scrapy 管理部署的爬虫项目的python类

分布式爬虫部署基于scrapy和scrapy-redis

8_3 scrapy模拟登录人人网

Python爬虫 - scrapy

Scrapy爬虫

用scrapy爬取图片

scrapy基本知识

Python爬虫 - scrapy框架的基本操作

十八、scrapy内置媒体（图片和文件）下载方式

Scrapy爬虫

Python Scrapy图片爬取原理及代码实例

heyboz