三步将一个普通的scrapy爬虫变为分布式爬虫
要将一个scrapy项目变为一个scrapy.redis项目只需要修改下面三点就可以了:
- 将爬虫类从scrapy.Spider 变成scrapy_redis.spiders.RedisSpider;或者从scripy.CrawlSpider变成scrapy_redis.spiders.RedisCrawlSpider。
- 将爬虫的start_urls删掉。增加一个redis_key="xxx"。这个redis_key是为了以后再redis中控制爬虫启动的。爬虫的第一个url,就是redis中通过这个发送出去的。
- 在配置文件中增加
运行爬虫:
1、在爬虫服务器上,进如爬虫文件所在路径,然后输入命令:scrapy runspider [爬虫名字]
2、在redis服务器上,推入一个开始的url链接(就是redis_key那里):redis-cli lpush [redis_key] start_url
需要注意的是在1步骤中,scrapy runspider [爬虫名字],其中[爬虫名字]不是name所指的,而是爬虫的py文件,如下图
相关推荐
andrewwf 2020-11-11
Arvinzx 2020-10-28
CycloneKid 2020-10-27
paleyellow 2020-10-25
baifanwudi 2020-10-25
heyboz 2020-10-21
wumxiaozhu 2020-10-16
ZHANGRENXIANG00 2020-07-27
zhangll00 2020-07-05
javaraylu 2020-06-28
ZHANGRENXIANG00 2020-06-28
Catastrophe 2020-06-26
Catastrophe 2020-06-26
fangjack 2020-06-25
andrewwf 2020-06-16
qyf 2020-06-14
荒乱的没日没夜 2020-06-14