【docker】CentOS6.8+Python3.7+selenium+Firefox的搭建
当前Docker容器配置:
- Centos6.8
- python2.6.6
- openssl-1.0.1
目标Docker容器配置:
- Centos6.8
- python3.7.4
- openssl-1.1.1
- selenium 3.141.0
- geckodriver 0.15
- firefox 52
- Pillow 6.1.0
- pytesseract 0.2.7
安装依赖环境
yum install -y zlib-devel bzip2-devel openssl-devel ncurses-devel sqlite-devel readline-devel tk-devel libffi-devel gcc make wget git unzip gcc gcc-c++ libjpeg-devel libpng-devel libgif-devel
创建目录存放安装包
mkdir /usr/local/download cd /usr/local/download
安装Python3.7.4
1.安装最新版本的openssl
可能会遇到的问题:
centos6.8 默认的openssl版本为1.0.1,而Python3.7需要的openssl版本最低为1.0.2,所以先安装最新版本的openssl。
cd /usr/local/download wget http://www.openssl.org/source/openssl-1.1.1.tar.gz tar -zxvf openssl-1.1.1.tar.gz cd openssl-1.1.1 ./config --prefix=/usr/local/openssl shared zlib make && make install
设置环境变量LD_LIBRARY_PATH
echo "export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/openssl/lib" >> $HOME/.bash_profile source $HOME/.bash_profile
这一步一定要有!!LD_LIBRARY_PATH
环境变量主要用于指定查找共享库(动态链接库)时除了默认路径之外的其他路径。当执行函数动态链接.so时,如果此文件不在缺省目录下/lib
and /usr/lib
,那么就需要指定环境变量LD_LIBRARY_PATH
2.安装python源码
cd /usr/local/download wget https://www.python.org/ftp/python/3.7.4/Python-3.7.4.tgz tar -xvf Python-3.7.4.tgz cd Python-3.7.4 # 编译 一定要指定刚才安装的1.1.1版本的openssl!!! ./configure --prefix=/usr/local/python-3.7 --with-openssl=/usr/local/openssl # 优化(执行该代码后,会编译安装到 /usr/local/bin/ 下,且不用添加软连接或环境变量) #./configure --enable-optimizations(不要执行,执行后python在导入ssl等相关包时会报错) # 编译和安装 make && make install # 备份原来的python mv /usr/bin/python /usr/bin/python.bak # 软连接 ln -s /usr/local/python-3.7/bin/python3 /usr/bin/python ln -s /usr/local/python-3.7/bin/pip3 /usr/bin/pip # 修改yum文件(因为yum是python2写的) vi /usr/bin/yum 将第一行python改为python2.6 如果存在/usr/libexec/urlgrabber-ext-down,则将其中第一行的python改为python2.6 # 配置pip源(豆瓣) [ ~]# cd [ ~]# mkdir .pip [ ~]# cd .pip [ .pip]# vi pip.conf #写入如下内容: [global] index-url=http://pypi.douban.com/simple trusted-host = pypi.douban.com
安装tesseract
# 先安装leptonica cd /usr/local/download wget http://www.leptonica.org/source/leptonica-1.72.tar.gz tar xvzf leptonica-1.72.tar.gz cd leptonica-1.72/ ./configure make && make install # 安装tesseract cd /usr/local/download wget https://github.com/tesseract-ocr/tesseract/archive/3.04.zip unzip 3.04.zip cd tesseract-3.04/ ./configure make && make install ldconfig # pip安装pytesseract pip install pytesseract # 安装语言包 在https://github.com/tesseract-ocr/tessdata 下载对应语言的模型文件 由于目前只需要识别手机号码和英文,只下载一个eng.traineddata文件即可, 将模型文件移动到/usr/local/share/tessdata 然后即可进行识别 # 示例 import pytesseract from PIL import Image image = Image.open('bb.png') code = pytesseract.image_to_string(image) print(code)
安装selenium+firefox+geckodriver
安装selenium
pip install selenium # 查看版本 pip show selenium
安装geckodriver
cd /usr/local/download wget https://github.com/mozilla/geckodriver/releases/download/v0.15.0/geckodriver-v0.15.0-linux64.tar.gz tar xvzf geckodriver-*.tar.gz rm -f /usr/bin/geckodriver # 软链接必须用绝对路径 ln -s /usr/local/download/geckodriver /usr/bin/geckodriver
安装firefox
cd /usr/local/download wget http://www.rpmfind.net/linux/centos/6.10/os/x86_64/Packages/firefox-52.8.0-1.el6.centos.x86_64.rpm yum install -y firefox-52.8.0-1.el6.centos.x86_64.rpm
安装中文字体
# 新建字体目录 chinese: mkdir /usr/share/fonts/chinese # 将windows系统盘 c:\windows\fonts\中的字体直接上传至 centos 的 /usr/share/fonts/chinese目录下即可 chmod -R 755 /usr/share/fonts/chinese yum -y install ttmkfdir ttmkfdir -e /usr/share/X11/fonts/encodings/encodings.dir # 修改fonts.conf的Font directory list,即字体列表,在这里需要把我们添加的中文字体位置加进去: vi /etc/fonts/fonts.conf <dir>/usr/share/fonts/chinese</dir> # 刷新内存中的字体缓存,这样就不用reboot重启了: fc-cache # 最后再次通过fc-list看一下字体列表: fc-list
安装 xvfb
在Linux中有1个很好用的工具xvfb,它是1个X服务可以用于在没有显示器的硬件和物理输入设备上运行
a,安装必需的软件包 [ ~]# sudo yum install xdg-utils xorg-x11-server-Xvfb xorg-x11-xkb-utils a,安装xvfb的绑定 [ ~]# pip install xvfbwrapper pyvirtualdisplay
pip安装所需包
#安装包 pip install requests pip install Pillow pip install httplib2 pip install excel
参考:
centos 解决python3.7 安装时No module named _ssl
关注公众号西加加先生
一起玩转Python。
相关推荐
chuckchen 2020-10-31
Will0 2020-10-12
Dreamhome 2020-10-09
xirongxudlut 2020-09-28
星辰大海的路上 2020-09-13
chaochao 2020-08-31
猪猪侠喜欢躲猫猫 2020-08-17
快递小可 2020-08-16
shengge0 2020-07-26
巩庆奎 2020-07-21
张文倩数据库学生 2020-07-19
xirongxudlut 2020-07-18
Ericbig 2020-07-18
kyelu 2020-07-09
liangzhouqu 2020-07-07
GuoSir 2020-06-28
chaigang 2020-06-27
pythonxuexi 2020-06-25