Docker 部署Scrapy的详解

oceanyang0

2018-04-10

假设我们要在10台Ubuntu 部署爬虫如何搞之？用传统的方法会吐血的，除非你记录下来每个步骤，然后步骤之间的次序还完全一样，这样才行。但是这样还是累啊，个别软件下载又需要时间。所以Docker出现了。Docker把系统，各种需要的应用，还有设置编译成一个image，然后 run一下就可以了。跟虚拟机的区别是不需要而外的物理支持，共用的。

1. 部署步骤

1.1 上传本地scrapy爬虫代码除了settings外到git 服务器

1.2 编写Dockerfile文件，把settings和requirements.txt 也拷贝到image里，一起打包成一个image

Dockerfile内容：

FROM ubuntu
RUN apt-get update
RUN apt-get install -y git
RUN apt-get install -y nano 
RUN apt-get install -y redis-server  
RUN apt-get -y dist-upgrade
RUN apt-get install -y openssh-server
RUN apt-get install -y python3.5 python3-pip
RUN apt-get install -y zlib1g-dev libffi-dev libssl-dev
RUN apt-get install -y libxml2-dev libxslt1-dev
RUN mkdir /code
WORKDIR /code
ADD ./requirements.txt /code/
ADD ./settings.py /code/
RUN mkdir /code/myspider
RUN pip3 install -r requirements.txt
VOLUME [ "/data" ]

requirements.txt 内容：

BeautifulSoup4
scrapy
setuptools
scrapy_redis
redis
sqlalchemy
pymysql
pillow

整个目录结构：

Docker 部署Scrapy的详解

docker build -t fox6419/scrapy:scrapyTag .

fox6419是用户名，scrapyTag是tag

成功后，执行docker images可以在本地看到image

1.3 打包的image 上传到docker hub中

docker push username/repository:tag

push的命令格式是这样的，我这边就是：

docker push fox6419/scrapy:scrapyTag

1.4 在DigitalOcean这种主机商创建带docker应用的Ubuntu 16.04版本

1.5 登陆docker，拉下1.3的image，然后run起来

docker run -it fox6419/scrapy:scrapyTag /bin/bash

1.6 命令进去后，git clone 1.1中的爬虫，然后复制images里的settings到爬虫目录，然后执行scrapy crawl xxx即可

docker docker命令 scrapy apt-get

oceanyang0

0 关注 0 粉丝 0 动态

关注关注

Docker使用Portainer搭建可视化界面的方法

Portainer是Docker的图形化管理工具，提供状态显示面板、应用模板快速部署、容器镜像网络数据卷的基本操作、事件日志显示、容器控制台操作、Swarm集群和服务等集中管理和操作、登录用户管理和控制等功能。功能十分全面，基本能满足中小型单位对容器管理的

魅惑青花瓷 2020-11-11

docker容器与宿主机的数据交互方式总结

在生产环境中使用 Docker ，往往需要对数据进行持久化，或者需要在多个容器之间进行数据共享，这必然涉及容器的数据管理操作。docker cp :用于容器与主机之间的数据拷贝。当删除Docker容器，并通过该镜像重新启动时，之前的更改将会丢失。在Dock

yangkang 2020-11-09

如何进入、退出docker的container实现

Docker的镜像称为image，容器称为container。对于Docker来说，image是静态的，类似于操作系统快照，而container则是动态的，是image的运行实例。比如，有一个image名称为ubuntu，那么比如现在我们启动这个image

MichaelJScofield 2020-11-06

详解docker pull 下来的镜像都存到了哪里

docker pull 下来的命令都默认存在/var/lib/docker/文件夹下。正好和docker images的内容一致。可以看到上面 repositories.json 文件中记录的就是已拉取的镜像信息。

TaoTaoFu 2020-11-06

优化Docker镜像，加速应用部署，教你几个小窍门

Docker 包含三个基本概念，分别是镜像、容器和仓库。Docker 镜像可以看作是一个特殊的文件系统，除了提供容器运行时所需的程序、库、资源、配置等文件外，还包含了一些为运行时准备的一些配置参数。镜像是 Docker 运行容器的前提，是Docker的核心

liaochaowu 2020-11-16

Docker不再是唯一的选择

Docker并不是唯一的容器化工具，可能还有更好的选择……在容器的早期时代，Docker是容器游戏中唯一的玩家。但现在情况已经不一样了，Docker不再是唯一的一个，而只是其中一个容器引擎而已。Docker允许我们构建、运行、拉、推或检查容器镜像，然而对于

ChlatZed 2020-11-11

Docker 卷到底是个啥玩意？从使用到深入！

Docker 支持持久化和非持久化两种方式的存储。非持久化化存储自动创建，从属于容器，生命周期与容器相同，即删除容器也会删除全部非持久化数据。卷与容器是解耦的，从而可以独立地创建并管理卷，并且卷也不与任意容器声明周期绑定，即用户删除一个关联了卷的容器，但是

lnkToKing 2020-10-29

IT工程师都需要掌握的容器技术之Docker存储管理

小伙伴们我们容器技术文章又来啦，今天这边文章主要为大家讲解容器存储，通过本篇文章我们可以了解到容器镜像结构、将主机数据挂载到容器的方式、容器数据卷及数据卷的备份与恢复等技术，下面我们就一起来学习吧!针对上述问题，Docker 提供了四种不同的方式将数据从

ChlatZed 2020-10-27

10个冷门但又非常实用的Docker使用技巧

在平时的工作中，docker 接触得很多，除了经常使用的 docker run ，docker stop等命令，docker 还有很多十分有用但是却不经常使用的命令，下面就来总结一下：。这个命令是用来查看一个容器里面的进程信息的，比如你想查看一个 ngi

时光流水 2020-09-23

谁说前端不用懂，手摸手 Docker 从入门到实践

本文转载自微信公众号「前端下午茶」，作者SHERlocked93。在下最近遇到要在服务器上安装 Mysql、Nginx、EasyMock 等工具的场景，这里记录一下我使用 Docker 安装的过程，希望也能在类似的场景中帮助到大家～。Docker 对这

yangkang 2020-09-23

docker镜像制作

和自动化发布平台集成的时候启动shell价值就出来了。另外此处自定了dockerfile的路径和名称，稍微。做了通用化的考虑。稍微需要注意的是 -f最好是全路径。

changecan 2020-09-22

Docker 容器监控方案怎么选？看看这套开源方案

随着线上服务的全面docker化，对docker容器的监控就很重要了。SA的监控系统是物理机的监控，在一个物理机跑多个容器的情况下，我们是没法从一个监控图表里面区分各个容器的资源占用情况的。为了更好的监控容器运行情况，更重要的是为了后续的容器动态调度算法需

dusuanyun 2020-09-21

Node.js web 应用如何封装到Docker容器中

小小又开始学习新的内容了。这次学习的是，把一个Node.js 应用封装到Docker容器，完成本教程的前提是拥有一个可以安装的，已经正常可以工作的Docker。本教程的第一部分，需要创建一个Web应用程序，然后为这个应用程序构建一个Docker镜像，最后把

newisI 2020-09-01

deepin apt命令安装最新版本的docker的方法

下载版本大于上面要求的rpm包，后面通过alien命令将rpm包转换成deb，再通过dpkg -i xxx.deb安装即可。然后在下载目录下打开终端执行 alien xxxx.rpm 即可在当前目录生成deb包，可以在图形界面化下双击安装

liaochaowu 2020-09-14

还不使用Docker管理数据，你是从1985年穿越来的吗？

本文转载自公众号“读芯术”。小白程序员面临的最大困难之一就是理解环境的概念。环境是指程序员进行编码的系统，这听起来貌似很容易，但随着程序员职业生涯的推荐，程序员会逐渐体会到维护“环境”是一件多么困难的事情。这主要是因为库、IDE，甚至Python代码都需要

ShangQuan0 2020-09-10

如何使用Docker容器化Node.js应用程序

容器化应用程序在当今世界越来越流行，因为它们能够解决几乎每个项目团队都面临的一些主要问题。在本文中，我将告诉你如何使用Docker容器化你的node.js应用程序。在继续之前，请确保你的计算机中已安装Docker。完成安装过程后，打开Docker Desk

fearlessxjdx 2020-09-04

Docker Swarm概念与基本用法

Docker Swarm是Docker公司开发的容器集群管理服务。从1.12.0版本开始，已经是Docker安装后自带的一部分了，又称为Swarm Mode，无需额外安装。与Kubernetes相比，Docker Swarm是一个简单的软件，似乎不堪大用。

libra0 2020-09-02

优化 Docker 镜像大小常见方法

平时我们构建的 Docker 镜像通常比较大，占用大量的磁盘空间，随着容器的大规模部署，同样也会浪费宝贵的带宽资源。本文将介绍几种常用的方法来优化 Docker 镜像大小，这里我们使用 Docker Hub 官方上的 Redis 镜像进行说明。我们能够直

ChlatZed 2020-08-23

快速制作Redis Docker镜像

现在容器化已经是趋势，制作镜像也是我们的基础工作。镜像越小，部署起来越方便。在这个方面，轻巧的Linux发行版本就是一个很好的选择，这里我们选择alpine linux 。目前最新版本是3.12.1。官方很友好的提供了minirootfs的包，这个包就是为

王道革 2020-11-25

安科网

Docker 部署Scrapy的详解

oceanyang0

oceanyang0

相关推荐

Docker使用Portainer搭建可视化界面的方法

docker容器与宿主机的数据交互方式总结

如何进入、退出docker的container实现

详解docker pull 下来的镜像都存到了哪里

优化Docker镜像，加速应用部署，教你几个小窍门

Docker不再是唯一的选择

Docker 卷到底是个啥玩意？从使用到深入！

IT工程师都需要掌握的容器技术之Docker存储管理

推荐给IT新手的11个Docker免费上手项目

10个冷门但又非常实用的Docker使用技巧

谁说前端不用懂，手摸手 Docker 从入门到实践

docker镜像制作

Docker 容器监控方案怎么选？看看这套开源方案

Node.js web 应用如何封装到Docker容器中

deepin apt命令安装最新版本的docker的方法

还不使用Docker管理数据，你是从1985年穿越来的吗？

如何使用Docker容器化Node.js应用程序

Docker Swarm概念与基本用法

优化 Docker 镜像大小常见方法

快速制作Redis Docker镜像

oceanyang0