首“战”爬虫

前言

曾经年少无知,笑对python爬虫。

如今首战未捷,却已头顶清凉...

奈何心中执着,不愿面对结果。

若有江湖侠客,还望拔刀相助!

思路

网站选取的是爱奇艺的电影排行

requests和bs4库的安装也较为轻松

爬取的过程比较顺利,问题出现在对信息的处理上

处理过程:1.简单了解函数find_all()

   2.在漫漫代码海中寻找有用信息【红】& 标签【黄】(如下)

首“战”爬虫

首“战”爬虫

   3.于是有代码诞生: soup.find_all(‘p‘,"site-piclist_info_title");

      but,康康运行结果....

源代码

首“战”爬虫

运行结果

首“战”爬虫

问题:

1.影片名(有重复)且缩在一堆代码中间...怎么弄出来??

2.除了find_all()函数,有没有更简洁的直接将文字信息提取出来的方法??

这是一个神奇的过程,尝试尝试再尝试,上头上头还是上头...

但这也是一个很快乐的过程,一直在探索,暂且不说结果或许不尽如人意,但是过程中但凡有的一点点进步,小的胜利,都让人无比愉悦,成就感爆棚。

我想,实践,大概就是编程的魅力所在吧,一直在尝试,一直在超越。

加油哦!