烂片休想糊弄我,Python爬虫豆瓣电影数据手到擒来

烂片休想糊弄我,Python爬虫豆瓣电影数据手到擒来

直接进入正题

下面开始爬豆瓣电影的电影数据,我们要获取 电影名、演员、评分。

烂片休想糊弄我,Python爬虫豆瓣电影数据手到擒来

烂片详情页

烂片休想糊弄我,Python爬虫豆瓣电影数据手到擒来

烂片详情页

我们就只爬烂片标签页的部分数据吧,网页链接规律如下

第一页https://movie.douban.com/tag/烂片?start=0

第二页https://movie.douban.com/tag/烂片?start=20

第三页https://movie.douban.com/tag/烂片?start=40

开始上代码

烂片休想糊弄我,Python爬虫豆瓣电影数据手到擒来

执行上述写好的代码

烂片休想糊弄我,Python爬虫豆瓣电影数据手到擒来

烂片休想糊弄我,Python爬虫豆瓣电影数据手到擒来

很多人在写爬虫的会被封IP,那么想要防止IP被封有以下几点:

烂片休想糊弄我,Python爬虫豆瓣电影数据手到擒来

  1. 伪装请求报头(request header)
  2. 减轻访问频率,速度
  3. 使用代理IP

相关推荐