selenium动态页面模拟点击

Reiki

2020-01-16

# 爬取斗鱼直播平台的所有房间信息：

#coding=utf-8
from selenium import webdriver
import json
import time
class Douyu:
    # 1.发送首页的请求
    def __init__(self):
        self.driver = webdriver.PhantomJS()
        self.driver.get("https://www.douyu.com/directory/all") #请求首页

    #获取没页面内容
    def get_content(self):
        time.sleep(3) #每次发送完请求等待三秒，等待页面加载完成
        li_list = self.driver.find_elements_by_xpath(‘//ul[@id="live-list-contentbox"]/li‘)
        contents = []
        for i in li_list: #遍历房间列表
            item = {}
            item["img"] = i.find_element_by_xpath("./a//img").get_attribute("src") #获取房间图片
            item["title"] = i.find_element_by_xpath("./a").get_attribute("title") #获取房间名字
            item["category"] = i.find_element_by_xpath("./a/div[@class=‘mes‘]/div/span").text #获取房间分类
            item["name"] = i.find_element_by_xpath("./a/div[@class=‘mes‘]/p/span[1]").text #获取主播名字
            item["watch_num"] = i.find_element_by_xpath("./a/div[@class=‘mes‘]/p/span[2]").text #获取观看人数
            print(item)
            contents.append(item)
        return contents
    #保存本地
    def save_content(self,contents):
        f = open("douyu.txt","a")
        for content in contents:
            json.dump(content,f,ensure_ascii=False,indent=2)
            f.write("\n")
        f.close()

    def run(self):
        #1.发送首页的请求
        #2.获取第一页的信息
        contents = self.get_content()
            #保存内容
        self.save_content(contents)
        #3.循环  点击下一页按钮，知道下一页对应的class名字不再是"shark-pager-next"
        while self.driver.find_element_by_class_name("shark-pager-next"): #判断有没有下一页
            #点击下一页的按钮
            self.driver.find_element_by_class_name("shark-pager-next").click() #
            # 4.继续获取下一页的内容
            contents = self.get_content()
            #4.1.保存内容
            self.save_content(contents)

if __name__ == "__main__":
    douyu = Douyu()
    douyu.run()

Reiki

0 关注 0 粉丝 0 动态

相关推荐

把手教您认识、搭建和使用Selenium WebDriver

作为一个开源的自动化测试框架，Selenium可以在不同的浏览器和平台上执行应用测试。其主要特征包括：。Selenium支持包括：Java、Python、C#、JavaScript、Ruby、PHP和Perl在内的多种编程语言。Selenium与平台无关，

xiangxiaojun 2020-09-23

Python selenium如何打包静态网页并下载

需要将自动化操作的一些图片截取下来，以作为后期图片匹配使用。='随文') & (df['完成情况'] !save_folder = r"I:\code\python\data\01 爬取微信公众号历史文章\01 二律背反的一灯如豆&quo

Reiki 2020-08-16

Python Selenium实现无可视化界面

有时候我们爬取网页数据，并不希望看其中的过程，只想看到最后的数据结果就可以了，这时候，***面就很有必要了！

letheashura 2020-08-14

Linux-Centos下selenium部署

请注意chrome和chromedriver的区别，前者是浏览器，后者是其驱动，而二者缺一不可。至此，恭喜你已经部署成功！

tiankele0 2020-07-29

Selenium 获取Select元素的选中值

obj_select = Select #强制类型转换为Select类型

Reiki 2020-07-28

自动化测试（1）selenium+python+chrome 连接测试

使用chrome和对应的webdriver. 将chromedriver放在chrome目录下，并解压运行。测试chromedriver是否配置成功，输入chromedriver. python下载selenium，输入pip install seleni

curiousL 2020-07-18

解决Selenium重复开启浏览器问题

在实际调试selenium自动化程序时，总是需要重新开启浏览器。以下方法解决不断重启浏览器问题。我们需要手动打开浏览器，进入到所需的页面，执行一些手动任务，如输入表单、输入验证码，登陆成功后，然后再开始运行自动化脚本。这种情况下如何使用selenium来接

王练 2020-07-18

Selenium打开浏览器加载慢的原因

在自动化元素定位操作中经常使用智能等待来加强定位的强壮性，主要就是因为WebDriver没有提供页面加载场景的方法；在使用JavaScript知识的突然心生灵感，可以使用JavaScript来配合验证页面加载，结果发现我真是井底之蛙。首先定位从Docume

tiankele0 2020-07-18

28 selenium

selenium是浏览器自动化框架，只是对于测试人员来说，是用来做web自动化测试。来看看测试金字塔，底层的单元测试unittest一般是开发自己自测，但是国内基本没有开发自测unittest,所以集成测试就比较看重。接口测试是web自动化测试很重要的。w

amei0 2020-07-08

使用selenium 和图片验证码识别对12306的模拟登录+12306查询车次

记得索引位置，有部分车次的索引位置完全相反！！！我晕，暂时没想到怎么搞。此处headers 和cookies 自己获取，记得加！‘_jc_save_toDate‘: ‘2020-07-06‘,‘_jc_save_wfdc_flag‘: ‘dc‘,‘_jc_

Reiki 2020-07-06

selenium的多层框架定位

案例是使用selenium自动登陆QQ空间。1 使用selenium自动请求QQ空间网站https://i.qq.com/。打开后出现如下页面。2 通过xpath定位到账号密码登录的位置，然后使用click点击对象。我们去QQ空间的网页源代码中发现了关键词

Ronnyxie 2020-07-06

使用selenium抓取深圳证券交易所信息

我们的目标是要获取深圳市场、深市主板、中小企业板、创业板下的数据。　　我们获取到页面的源码后，通过查找页面源码的内容发现，并没有我们需要的数据。因此该网站把数据存储在接口里。　　获取数据的方式：①通过接口 ②使用selinum操作对象的text获取元素文本

xiangxiaojun 2020-07-05

Selenium系列之--06 CSS SELECTOR选择器的一些写法

//div#radio>input:nth-of-type 选择id为radio的div下的第4个input节点。//input.Volvo[name=‘identity‘] 选择class为.Volvo并且name为identity的input节点

zhanghaibing00 2020-06-28

【selenium学习高级篇 -31】Jenkins中Project的相关配置

上一篇中说了如何新建一个Project，接下来，我们讲继续详细的讨论如何去设置相关的配置。a,Build Periodically，周期性进行构建，某一个时刻自动去构建。第一颗*表示分钟，取值0~59第二颗*表示小时，取值0~23第三颗*表示一个月的第几天

xiongyouqiang 2020-06-28

selenium 基于Autolt工具对于Windows窗口上传文件操作

这里推荐使用Autoit 工具。这些值在步骤4中用于编写AutoIT脚本。ControlClick方法的参数值:1、第一个参数标题为“open”。下面可以看到，处理文件上传程序的AutoIT脚本已经完成。现在可以关闭元素识别器并将脚本以“FileUploa

Ronnyxie 2020-06-27

selenium环境搭建，driver方法简述

准备对应版本的geckdriver.exe文件。如果没有配置chromerdriver环境变量的话，要通过参数去进行指定chromerdriver的路径。但是存在一个问题。在团队工作的时候，如果各个成员的环境不同，最好不要采用配置到环境变量中的方式进行配置

amei0 2020-06-26

selenium键盘操作，执行JS，上传文件

selenium内置了执行js代码的api。# ----------------------------通过js代码修改元素的属性--------------------. return ‘操作完了‘;# -----------------------通过

letheashura 2020-06-26

selenium三大切换，三大等待

time.sleep() # 使用time模块强制进行等待，单位s. # 将选择器的方式，改成BY模块。工作中常见用法如下。显示等待的等待条件，应用场景。整理一下用到的包和常规的简写。1，切换iframe，通过iframe名字。2，通过索引去切换。6，切

tiankele0 2020-06-26

selenium(二)

selenium需要与浏览器交互就需要导入Action Chains,主要用于模拟鼠标的行为，比如单击、双击、拖动等；当调用perform()方法时，队列中的事件会依次进行。　　2) 鼠标单击且按住不放。　　3) 执行鼠标右键操作。　　4) 执行鼠标左键双

王练 2020-06-25

selenium中三大窗口切换

　　这类窗口也就是我们常说的句柄，句柄的切换是有必要的，我们自己手动在网页上从操作的话，产生新的句柄时浏览器会自动的帮我们跳转到最新的句柄处，但是我们在做UI自动化的时候，代码并不会帮我们自动的切换到最新的句柄，需要我们使用代码去进行切换　　　　。除了切换

xiangxiaojun 2020-06-25

Reiki

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号