2月2日学习记录

MiracleZhao

2020-02-02

关注关注

1，背诵单词：substitute：替代者，替代物 valid：有效的 wax：蜡，蜡状物 stubborn：顽固的，固执的 abstract：抽象的 ankle：踝关节，踝 occasionally：偶尔 trace：踪迹

　　　　 export：出口，输出 scan：扫描，细看 stale：陈腐的，不新鲜的 venture：冒险行事 amongst：处在.....中 calculate：计算，估计 victim：牺牲者，受害者

　　　　aluminium：铝 explode：使爆炸 variable：变化的，可变的 vote：投票，选举 waiter：侍者，服务员 ton：吨 wolf：狼，贪婪的人 vacation：假期，休眠

2，学习Python爬虫的Scrapy框架的使用观看视频：https://www.bilibili.com/video/av9784617 从48集看到60集

　　发布博客：https://i-beta.cnblogs.com/posts/edit-done;postId=12254076

（一）Scrapy库概述

　　1，安装：运行D:\Python\Python36\python.exe -m pip install --upgrade pip命令升级

　　　　修改Python36文件的权限：https://www.cnblogs.com/liaojiafa/p/5100550.html

　　　　安装：D:\Python\Python36\python.exe -m pip install wheel

　　　　安装：D:\Python\Python36\python.exe -m pip install scrapy

　　　　安装过程出了很多问题，比如升级pip要修改Python文件的权限；安装Scrapy库前要安装wheel；还有教程要单独安装Twisted?xxx?win_amd64.whl，还有修改名称，结果一直不通过，一点用没有；最重要的是网络要好，不然网速太慢很多文件下载好多分钟最后保错还不知道什么地方出问题了。最后换了一个网，很快就安装成功了。

2月2日学习记录

（二）Scrapy库的使用

　　 2月2日学习记录

　　爬取某个HTML：

　　建立过程： scrapy startproject python123demo

　　建立爬虫demo：scrapy genspider demo python123.io；建立demo.py文件

　　修改爬虫文件deom.py文件

　　运行爬虫：scrapy crawl demo

（1）request类：

　　　　 2月2日学习记录

　　　　（2）response类：

　　　　 2月2日学习记录

　　　　（3）Item类：类字典类型，可以按照字典类型操作；表示从HTML中提取的内容

CSS Selector：

　　 2月2日学习记录

3，练习写了爬取股票信息：发现requests库+BeautifulSoup库爬取多个网页时运行速度非常慢

4，明天计划继续背单词；继续学习使用Scrapy库爬取股票数据；学习Spark

python

安科网

2月2日学习记录

MiracleZhao

MiracleZhao

相关推荐

python 发送get请求接口详解

python 使用tkinter+you-get实现视频下载器

python中requests模拟登录的三种方式(携带cookie/session进行请求网站)

python开发一个解析protobuf文件的简单编译器

python 下载文件的多种方法汇总

Linux Shell 如何获取参数的方法

python跨文件使用全局变量的实现

Python爬虫破解登陆哔哩哔哩的方法

python调用百度API实现人脸识别

Python调用ffmpeg开源视频处理库，批量处理视频

详解python os.path.exists判断文件或文件夹是否存在

python实现在列表中查找某个元素的下标示例

python如何获得list或numpy数组中最大元素对应的索引

Python实现列表索引批量删除的5种方法

python 爬虫如何实现百度翻译

致命错误！Python开发者的7个崩溃瞬间

针对Python开发人员的10个“疯狂”的项目构想

用Python内置模块处理ini配置文件

VS Code 中 Python 扩展的部分功能重构，支持 R 和 Julia

Python五个隐藏的特性，你可能从未听说过

MiracleZhao