python爬虫使用requests请求无法获取网页元素时终极解决方案

sunzhihaofuture

2020-06-14

　　爬取数据时，有时候会出现无法通过正常的requests请求获取网页内容，导致数据无法抓取到，遇到这种情况时，可以换种思路去爬取数据，使用PhantomJS，即爬虫终极解决方案去获取页面元素。

#!/usr/local/bin/python3.7

from selenium import webdriver
import time

# phantomJS路径
path = ‘/Users/mozili/Documents/PhantomJS/phantomjs-2.1.1-macosx/bin/phantomjs‘
# 创建浏览器对象
browser = webdriver.PhantomJS(path)

# 打开百度并操作
url = ‘https://www.baidu.com‘
browser.get(url)
time.sleep(1)
# 截图
browser.save_screenshot(‘Reptile/phantomjs_img/baidu.png‘)
# 定位搜索框
search = browser.find_element_by_id(‘kw‘)
time.sleep(1)
# 在搜索框输入内容
search.send_keys(‘美女‘)
time.sleep(1)
# 截图
browser.save_screenshot(‘Reptile/phantomjs_img/meinv.png‘)
# 关闭浏览器
browser.quit()

phantomjs python爬虫

sunzhihaofuture

0 关注 0 粉丝 0 动态

相关推荐

XSS BOT编写

而它支持chrome webdriver、firefox webdirver、PhantomJS等，但是呢前2个就需要有桌面，而我们的docker环境是没有桌面的，所以就只能选择PhantomJS了。$sql = "SELECT password

某先生 2020-06-13

PhantomJS介绍与使用

　　一款无界面浏览器。

starwmx0 2020-05-31

python之Phantomjs无界面浏览器引擎自动化测试

文字搬运工，本文主要介绍PhantomJS功能，其中有屏幕快照功能，为后面更新,其中新版本中新增自动发送邮件功能正文带图片，使用PhantomJS截取图片后发送邮件,已发版本可看往期。PhantomJS是一个无界面的，基于 WebKit 的服务器端 Jav

hongxiangping 2020-05-07

selenium的用法

　　可以获取动态加载的数据。　　实例化某一款浏览器的驱动，获取一个对象。　　使用对象中的相关方法制定一系列的事件。六、自动百度搜索刘德华案例。# 1. 定位到输入框。# 2. 键入刘德华关键字。# 3. 定位到"百度一下"按钮。# 4.

tiankele0 2020-04-15

selenium + phantomjs/Chrome

1,定义：Web自动化测试工具，应用于web自动化测试。1,可以运行在浏览器上，根据指定的命令操作浏览器，让浏览器自动加载页面。2,只是工具，不支持浏览器功能，需要与第三方浏览器结合使用。1,将下载的可执行文件放到Python安装目录的Scripts目录下

songerxing 2020-03-23

linux下载phantomjs记录

可以直接进网址下载到本地后，再传到linux路径，例如phantomjs-1.9.7-linux-x86_64.tar.bz2

wangrui0 2020-02-17

Selenium

Selenium是一个Web的自动化测试工具，最初是为网站自动化测试而开发的，类型像我们玩游戏用的按键精灵，可以按指定的命令自动操作，不同是Selenium 可以直接运行在浏览器上，它支持所有主流的浏览器。Selenium 可以根据我们的指令，让浏览器自动

amei0 2020-01-23

前端自动化测试套件

作为前端开发人员，前端的自动化测试一直是个很棘手的问题，尤其是涉及UI交互层面的。传统的手工测试方式实在太落后以及重复劳动了，程序员就是懒人，总得想方设法释放自己的劳动力。最近项目没那么忙了，抽点时间了解了下现有的一些自动化测试框架套件，此文只是抛砖引玉，

Pinkr 2013-05-13

selenium：指挥浏览器工作

selenium可以用几行代码，控制浏览器，做出自动打开、输入、点击等操作，就像是有一个真正的用户在操作一样。在遇到页面交互复杂或是URL加密逻辑复杂的情况时，selenium就派上了用场，它可以真实地打开一个浏览器，等待所有数据都加载到Elements中

编程我在行 2020-01-18

爬虫学习 08.Python网络爬虫之图片懒加载技术、selenium和PhantomJS

什么是图片懒加载？为了解决这种问题，通过前后端配合，使图片仅在浏览器当前视窗内出现时才加载该图片，达到减少首屏图片请求数的技术就被称为“图片懒加载”。当图片出现到页面的可视化区域中，会动态将伪属性替换成src属性，完成图片的加载。

sunzhihaofuture 2020-01-09

PhantomJS使用Chrome或Firefox的无头版本来替代

CSDN上的孔天逸从Mozilla上提供了Selenium+Headless Firefox在Python上实现的方法：。driver = Firefox # 配了环境变量第一个参数就可以省了，不然传绝对路径。作者也说了，本地要有Firefox；本地要有g

zhaoyingm 2019-12-12

16、web爬虫讲解2—PhantomJS虚拟浏览器+selenium模块操作PhantomJS

phantomjs 是一个基于js的webkit内核无头浏览器也就是没有显示界面的浏览器，利用这个软件，可以获取到网址js加载的任何信息，也就是可以获取浏览器异步加载的信息

amei0 2019-11-08

html转换为pdf

为了解决linux下可以完美渲染，在网上查找了很多资料，最终发现phantomjs的pdf生成功能依赖于另一个项目wkhtmltopdf。需要注意的是，在linux下生成生成pdf很由可能会产生乱码的问题，主要是linux服务器上缺少字体。可以将windo

爱好HtmlCssJs 2019-11-01

PhantomJS快速入门教程

PhantomJS是一个基于WebKit的服务器端JavaScriptAPI。它全面支持web而不需浏览器支持，其快速，原生支持各种Web标准： DOM 处理, CSS 选择器, JSON, Canvas, 和 SVG。PhantomJS可以用于页面自动化

ruler 2015-04-13

CasperJS PhantomJS

因为要做一个模拟网页登录的一个测试代码，搜索了一下网页。Python写爬虫的介绍，发现下面一个js库，Python在学习，Node.js看来也得去学习学习。CasperJS简化了完整的导航场景的过程定义，提供了用于完成常见任务的实用的高级函数、方法和语法。

ncisoft 2015-06-04

无头浏览器，从phantomjs到webkit4j

无头浏览器即headless browser，是一种没有界面的浏览器。既然是浏览器那么浏览器该有的东西它都应该有，只是看不到界面而已。基于Webkit的浏览器很多，比如Safari，Chrome，Opera. PhantomJS可以说是目前使用最为广泛，也

浅陌游离 2016-11-15

使用Phantomjs和Node完成网页的截屏快照的方法

由于甲方爸爸的需要,最近使用phantomjs和Node写了一个对网页内容截屏的功能，为了避免忘记,现在将代码内容及配置流程大概描述一下.配置完成之后,在cmd命令行中输入 phantomjs -v检验是否配置成功,配置成功之后，如下图所示:. app.u

凌云客 2019-07-16

利用PhantomJS 自动截图Kibana ，python发送网站运营日报

kibana配置视图，并做好条件过滤视图，这里就是做介绍，可以参考博文，# yum -y install gcc gcc-c++ make flex bison gperf ruby \. page.viewportSize = { width: 1600

lindiwo 2016-10-19

ubuntu12.04安装jdk7,android studio，14.04安装chrome, phantomjs

It'll keep your java 7 installation up to date.To automatically set up the Java 7 environment variables JAVA_HOME and PATH:

ljqscdnljq 2014-07-26

phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。

sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6. 这里要执行source/etc/profile,以另刚才的改动生效。可以看到一

wwater 2014-09-24

sunzhihaofuture

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号