实例练习:正则表达式爬取百度贴吧照片
代码出自小甲鱼,复盘,省略了图片的下载部分
正则真的太好用了,不过关键在你想不想的到最高效的正则表达式
#!/usr/bin/env python # -*- coding: utf-8 -*- import urllib.request import re url = "https://tieba.baidu.com/p/6512141636" def web(url): response = urllib.request.urlopen(url) html = response.read().decode(‘UTF-8‘,‘ignore‘) test = r‘<img class="BDE_Image" src="([^"]+\.jpg)"‘ out = re.findall(test,html) print(out) web(url)
相关推荐
AHuqihua 2020-06-14
wangzhaotongalex 2020-10-20
wyq 2020-11-11
TLROJE 2020-10-26
风雨断肠人 2020-10-13
duanqingfeng 2020-09-29
rechanel 2020-11-16
cshanzhizi 2020-10-16
luofuIT成长记录 2020-09-22
phphub 2020-09-10
taomengxing 2020-09-07
MaggieRose 2020-08-19
flyingssky 2020-08-18
山水沐光 2020-08-18
jyj00 2020-08-15
AHuqihua 2020-08-09
山水沐光 2020-08-03