python爬虫使用requests请求无法获取网页元素时终极解决方案
爬取数据时,有时候会出现无法通过正常的requests请求获取网页内容,导致数据无法抓取到,遇到这种情况时,可以换种思路去爬取数据,使用PhantomJS,即爬虫终极解决方案去获取页面元素。
#!/usr/local/bin/python3.7 from selenium import webdriver import time # phantomJS路径 path = ‘/Users/mozili/Documents/PhantomJS/phantomjs-2.1.1-macosx/bin/phantomjs‘ # 创建浏览器对象 browser = webdriver.PhantomJS(path) # 打开百度并操作 url = ‘https://www.baidu.com‘ browser.get(url) time.sleep(1) # 截图 browser.save_screenshot(‘Reptile/phantomjs_img/baidu.png‘) # 定位搜索框 search = browser.find_element_by_id(‘kw‘) time.sleep(1) # 在搜索框输入内容 search.send_keys(‘美女‘) time.sleep(1) # 截图 browser.save_screenshot(‘Reptile/phantomjs_img/meinv.png‘) # 关闭浏览器 browser.quit()
相关推荐
某先生 2020-06-13
hongxiangping 2020-05-07
tiankele0 2020-04-15
songerxing 2020-03-23
wangrui0 2020-02-17
amei0 2020-01-23
Pinkr 2013-05-13
编程我在行 2020-01-18
sunzhihaofuture 2020-01-09
zhaoyingm 2019-12-12
amei0 2019-11-08
爱好HtmlCssJs 2019-11-01
ruler 2015-04-13
ncisoft 2015-06-04
浅陌游离 2016-11-15
凌云客 2019-07-16
lindiwo 2016-10-19
ljqscdnljq 2014-07-26