19、 Python快速开发分布式搜索引擎Scrapy精讲—css选择器
【百度云搜索,搜各种资料:http://www.lqkweb.com】
【搜网盘,搜各种资料:http://www.swpan.cn】
css选择器
1、
2、
3、
::attr()获取元素属性,css选择器
::text获取标签文本
举例:
extract_first('')获取过滤后的数据,返回字符串,有一个默认参数,也就是如果没有数据默认是什么,一般我们设置为空字符串
extract()获取过滤后的数据,返回字符串列表
# -*- coding: utf-8 -*- import scrapy class PachSpider(scrapy.Spider): name = 'pach' allowed_domains = ['blog.jobbole.com'] start_urls = ['http://blog.jobbole.com/all-posts/'] def parse(self, response): asd = response.css('.archive-title::text').extract() #这里也可以用extract_first('')获取返回字符串 # print(asd) for i in asd: print(i)
【转载自:http://www.lqkweb.com】
相关推荐
章鱼之家 2020-10-29
liangwenrong 2020-07-31
IceStreamLab 2020-06-26
yanweiqi 2020-06-25
章鱼之家 2020-06-14
章鱼之家 2020-06-08
yanweiqi 2020-06-01
IceStreamLab 2020-05-31
athrenzala 2020-05-30
athrenzala 2020-05-28
chenluhan 2020-05-28
yanweiqi 2020-05-09
etedyh 2020-05-10
athrenzala 2020-04-17
huhu 2020-03-01
qiburen 2020-03-20
WEB程序员 2020-03-18
yanweiqi 2020-03-03
柳永法的个人 2020-03-03