每天五分钟python爬虫—Selenium库详细教程（附全套爬虫教程分享

LilyXL

2019-03-31

关注关注

在我们爬取网页过程中，经常发现我们想要获得的数据并不能简单的通过解析HTML代码获取，这些数据是通过AJAX异步加载方式或经过JS渲染后才呈现在页面上显示出来。

selenuim是一种自动化测试工具，它支持多种浏览器。而在爬虫中，我们可以使用它来模拟浏览器浏览页面，进而解决JavaScript渲染的问题。

1. 使用示例

每天五分钟python爬虫—Selenium库详细教程（附全套爬虫教程分享

2. 详细介绍

2.1 声明浏览器对象

即告诉程序，应该使用哪个浏览器进行操作

每天五分钟python爬虫—Selenium库详细教程（附全套爬虫教程分享

2.2 访问页面

每天五分钟python爬虫—Selenium库详细教程（附全套爬虫教程分享

2.3 查找元素

成功访问网页后，我们可能需要进行一些操作，比如找到搜索框然后输入关键字再敲击回车键。

因此，就需要在selenium中查找元素。

2.3.1 单个元素

selenium查找元素有两种方法。

第一种，是指定使用哪种方法去查找元素，比如指定依照CSS选择或者依照xpath去进行查找

每天五分钟python爬虫—Selenium库详细教程（附全套爬虫教程分享

下面是详细的元素查找方法

find_element_by_name

find_element_by_xpath

find_element_by_link_text

find_element_by_partial_link_text

find_element_by_tag_name

find_element_by_class_name

find_element_by_css_selector

第二种，是直接使用find_element()，传入的第一个参数为需要使用的元素查找方法

每天五分钟python爬虫—Selenium库详细教程（附全套爬虫教程分享

2.3.2 多个元素

查找多个元素和查找单个元素的方法基本一致(只需要将查找单个元素的func里加一个s)。

查找多个元素返回的是一个list。

每天五分钟python爬虫—Selenium库详细教程（附全套爬虫教程分享

2.4 元素交互操作

元素交互是先获取一个元素，然后对获取的元素调用交互方法。

比如说在搜索框内输入文字：

每天五分钟python爬虫—Selenium库详细教程（附全套爬虫教程分享

2.5 交互动作

交互动作是将动作附加到交互链中串行执行，需要使用到ActionChains。

2.6 执行JavaScript

比如拖拽下拉

每天五分钟python爬虫—Selenium库详细教程（附全套爬虫教程分享

2.7 获取元素信息

已经通过元素查找获取到元素后，可能还需要获取这个元素的属性、文本

2.7.1 获取属性

每天五分钟python爬虫—Selenium库详细教程（附全套爬虫教程分享

2.8 Frame

如果定位到父frame，是无法查找到子frame的信息的，因此需要切换到子frame再进行查找。同理，在子frame也无法查找到父frame的信息

每天五分钟python爬虫—Selenium库详细教程（附全套爬虫教程分享

2.9 等待

请求网页时，可能会存在AJAX异步加载的情况。而selenium只会加载主网页，并不会考虑到AJAX的情况。因此，使用时需要等待一些时间，让网页加载完全后再进行操作。

2.9.1 隐式等待

使用隐式等待时，如果webdriver没有找到指定的元素，将继续等待。超出规定时间后，如果还是没又找到指定元素则抛出找不到元素的异常。默认等待时间为0。

隐式等待是对整个页面进行等待。

需要特别说明的是：隐性等待对整个driver的周期都起作用，所以只要设置一次即可。

每天五分钟python爬虫—Selenium库详细教程（附全套爬虫教程分享

2.9.2 显式等待

显示等待包含了等待条件和等待时间。

首先判定等待条件是否成立，如果成立，则直接返回；如果条件不成立，则等待最长时间为等待时间，如果超过等待时间后仍然没有满足等待等待条件，则抛出异常。

显式等待是对指定的元素进行等待。

每天五分钟python爬虫—Selenium库详细教程（附全套爬虫教程分享

2.10 浏览器的前进/后退

back实现回到前一页面，forward实现前往下一页面

每天五分钟python爬虫—Selenium库详细教程（附全套爬虫教程分享

2.11 对Cookies进行操作

每天五分钟python爬虫—Selenium库详细教程（附全套爬虫教程分享

2.12 选项卡管理

选项卡管理就是浏览器的标签。有些时候我们需要在浏览器里增加一个新标签页或者删除一个标签页，就可以使用selenium来实现。

每天五分钟python爬虫—Selenium库详细教程（附全套爬虫教程分享

柠檬为大家准备了一些python的学习教程分享，希望可以帮助到大家。

每天五分钟python爬虫—Selenium库详细教程（附全套爬虫教程分享

获取方式：请大家转发+关注并私信小编关键词：“资料”即可获取全套python爬虫教程。

selenium python python爬虫教程

LilyXL

0 关注 0 粉丝 0 动态

关注关注

把手教您认识、搭建和使用Selenium WebDriver

作为一个开源的自动化测试框架，Selenium可以在不同的浏览器和平台上执行应用测试。其主要特征包括：。Selenium支持包括：Java、Python、C#、JavaScript、Ruby、PHP和Perl在内的多种编程语言。Selenium与平台无关，

xiangxiaojun 2020-09-23

Python selenium如何打包静态网页并下载

需要将自动化操作的一些图片截取下来，以作为后期图片匹配使用。='随文') & (df['完成情况'] !save_folder = r"I:\code\python\data\01 爬取微信公众号历史文章\01 二律背反的一灯如豆&quo

Reiki 2020-08-16

Python Selenium实现无可视化界面

有时候我们爬取网页数据，并不希望看其中的过程，只想看到最后的数据结果就可以了，这时候，***面就很有必要了！

letheashura 2020-08-14

Linux-Centos下selenium部署

请注意chrome和chromedriver的区别，前者是浏览器，后者是其驱动，而二者缺一不可。至此，恭喜你已经部署成功！

tiankele0 2020-07-29

Selenium 获取Select元素的选中值

obj_select = Select #强制类型转换为Select类型

Reiki 2020-07-28

自动化测试（1）selenium+python+chrome 连接测试

使用chrome和对应的webdriver. 将chromedriver放在chrome目录下，并解压运行。测试chromedriver是否配置成功，输入chromedriver. python下载selenium，输入pip install seleni

curiousL 2020-07-18

解决Selenium重复开启浏览器问题

在实际调试selenium自动化程序时，总是需要重新开启浏览器。以下方法解决不断重启浏览器问题。我们需要手动打开浏览器，进入到所需的页面，执行一些手动任务，如输入表单、输入验证码，登陆成功后，然后再开始运行自动化脚本。这种情况下如何使用selenium来接

王练 2020-07-18

Selenium打开浏览器加载慢的原因

在自动化元素定位操作中经常使用智能等待来加强定位的强壮性，主要就是因为WebDriver没有提供页面加载场景的方法；在使用JavaScript知识的突然心生灵感，可以使用JavaScript来配合验证页面加载，结果发现我真是井底之蛙。首先定位从Docume

tiankele0 2020-07-18

28 selenium

selenium是浏览器自动化框架，只是对于测试人员来说，是用来做web自动化测试。来看看测试金字塔，底层的单元测试unittest一般是开发自己自测，但是国内基本没有开发自测unittest,所以集成测试就比较看重。接口测试是web自动化测试很重要的。w

amei0 2020-07-08

使用selenium 和图片验证码识别对12306的模拟登录+12306查询车次

记得索引位置，有部分车次的索引位置完全相反！！！我晕，暂时没想到怎么搞。此处headers 和cookies 自己获取，记得加！‘_jc_save_toDate‘: ‘2020-07-06‘,‘_jc_save_wfdc_flag‘: ‘dc‘,‘_jc_

Reiki 2020-07-06

selenium的多层框架定位

案例是使用selenium自动登陆QQ空间。1 使用selenium自动请求QQ空间网站https://i.qq.com/。打开后出现如下页面。2 通过xpath定位到账号密码登录的位置，然后使用click点击对象。我们去QQ空间的网页源代码中发现了关键词

Ronnyxie 2020-07-06

使用selenium抓取深圳证券交易所信息

我们的目标是要获取深圳市场、深市主板、中小企业板、创业板下的数据。　　我们获取到页面的源码后，通过查找页面源码的内容发现，并没有我们需要的数据。因此该网站把数据存储在接口里。　　获取数据的方式：①通过接口 ②使用selinum操作对象的text获取元素文本

xiangxiaojun 2020-07-05

Selenium系列之--06 CSS SELECTOR选择器的一些写法

//div#radio>input:nth-of-type 选择id为radio的div下的第4个input节点。//input.Volvo[name=‘identity‘] 选择class为.Volvo并且name为identity的input节点

zhanghaibing00 2020-06-28

【selenium学习高级篇 -31】Jenkins中Project的相关配置

上一篇中说了如何新建一个Project，接下来，我们讲继续详细的讨论如何去设置相关的配置。a,Build Periodically，周期性进行构建，某一个时刻自动去构建。第一颗*表示分钟，取值0~59第二颗*表示小时，取值0~23第三颗*表示一个月的第几天

xiongyouqiang 2020-06-28

selenium 基于Autolt工具对于Windows窗口上传文件操作

Ronnyxie 2020-06-27

selenium环境搭建，driver方法简述

准备对应版本的geckdriver.exe文件。如果没有配置chromerdriver环境变量的话，要通过参数去进行指定chromerdriver的路径。但是存在一个问题。在团队工作的时候，如果各个成员的环境不同，最好不要采用配置到环境变量中的方式进行配置

amei0 2020-06-26

selenium键盘操作，执行JS，上传文件

selenium内置了执行js代码的api。# ----------------------------通过js代码修改元素的属性--------------------. return ‘操作完了‘;# -----------------------通过

letheashura 2020-06-26

selenium三大切换，三大等待

time.sleep() # 使用time模块强制进行等待，单位s. # 将选择器的方式，改成BY模块。工作中常见用法如下。显示等待的等待条件，应用场景。整理一下用到的包和常规的简写。1，切换iframe，通过iframe名字。2，通过索引去切换。6，切

tiankele0 2020-06-26

selenium(二)

selenium需要与浏览器交互就需要导入Action Chains,主要用于模拟鼠标的行为，比如单击、双击、拖动等；当调用perform()方法时，队列中的事件会依次进行。　　2) 鼠标单击且按住不放。　　3) 执行鼠标右键操作。　　4) 执行鼠标左键双

王练 2020-06-25

selenium中三大窗口切换

　　这类窗口也就是我们常说的句柄，句柄的切换是有必要的，我们自己手动在网页上从操作的话，产生新的句柄时浏览器会自动的帮我们跳转到最新的句柄处，但是我们在做UI自动化的时候，代码并不会帮我们自动的切换到最新的句柄，需要我们使用代码去进行切换　　　　。除了切换

xiangxiaojun 2020-06-25

安科网

每天五分钟python爬虫—Selenium库详细教程（附全套爬虫教程分享

LilyXL

柠檬为大家准备了一些python的学习教程分享，希望可以帮助到大家。

获取方式：请大家转发+关注并私信小编关键词：“资料”即可获取全套python爬虫教程。

LilyXL

相关推荐

把手教您认识、搭建和使用Selenium WebDriver

Python selenium如何打包静态网页并下载

Python Selenium实现无可视化界面

Linux-Centos下selenium部署

Selenium 获取Select元素的选中值

自动化测试（1）selenium+python+chrome 连接测试

解决Selenium重复开启浏览器问题

Selenium打开浏览器加载慢的原因

28 selenium

使用selenium 和图片验证码识别对12306的模拟登录+12306查询车次

selenium的多层框架定位

使用selenium抓取深圳证券交易所信息

Selenium系列之--06 CSS SELECTOR选择器的一些写法

【selenium学习高级篇 -31】Jenkins中Project的相关配置

selenium 基于Autolt工具对于Windows窗口上传文件操作

selenium环境搭建，driver方法简述

selenium键盘操作，执行JS，上传文件

selenium三大切换，三大等待

selenium(二)

selenium中三大窗口切换

LilyXL