为ML模型注入灵魂：基于MVP的超简单部署方案

GodsLeft

2020-06-02

本文转载自公众号“读芯术”(ID：AI_Discovery)

开发一个出色的机器学习模型是一件棘手的事，但即使开发完成也不意味着工作的结束。在部署之前，它仍然毫无用处，他人可以轻易访问。

部署模型的方法有很多，笔者想谈一种适用于基本MVP的非常简单的解决方案——使用Flask为模型编写API，将Gunicorn用于软件服务器，将Nginx用于网站服务器，并将其包装在Docker中，以便更轻松地在其他机器(特别是AWS和GCP)上进行部署。

为ML模型注入灵魂：基于MVP的超简单部署方案

设置服务器

笔者更喜欢用专门为此租用的服务器，而不是使用私人或工作硬件对新配置进行实验。这样，即使某些东西被严重损毁，也无关紧要。

因此笔者建议使用Linode，笔者本人就是用其来进行实验的，它们的硬件使用感不错。只要在Ubuntu18.04 LTS上，就可以随心所欲使用其他任何服务。

这一部分适合使用Linides的人借鉴。导航到Linodes，然后单击“添加Linode”。有些东西需要填写。在发行版中，笔者建议选择Ubuntu18.04 LTS映像：

该区域——靠近你的区域(笔者用的是法兰克福，德国)
Linode计划——Nanode(每月仅需5美元，就需求而言足够了)
根密码——你的密码

然后单击“创建”。大约几分钟后，可以转到“网络”，在这里能找到有关通过SSH访问服务器的信息。

下一步应连接服务器，并创建具有sudo特权的非根用户。这个操作背后的逻辑相当简单：你不想在服务器上把所有东西都作为根运行，因为这样更容易损坏东西。

adduser usernameusermod -aG sudousername

最终，切换到新用户。

su — username

创建应用容器

整个系统配置分为两部分：应用程序容器(Flask +Gunicorn)和Web容器(Nginx Web服务器)。

图源：unsplash

(1) 步骤0——安装Docker和Docker Compose

Docker和Docker-compose安装非常简单，分别在4行和2行内就能完成。

(2) 步骤1——创建FlaskApp和WSGI入口点

在主目录中创建flask app目录，并将以下文件放入其中。

from flask importFlask 
             server =Flask(__name__) 
             @server.route('/') 
      defhello_world(): 
          return'hello world!'

这是最基础的Flask应用，几乎没有任何功能，不用加载任何模型，不添加任何GET /POST请求和内容(这些将在下文出现)。现在，我们只有一个主页上显示着“ helloworld”的应用程序。

这部分极为简单——只需为Gunicorn创建一个在端口8000上运行的单独文件。

(3) 步骤2——为Flask创建一个Docker映像

现在，我们需要创建一个将运用这些文件的Dockerfile，并创建一个稍后能运行的映像。

FROM python:3.6.7 
             WORKDIRusr/src/flask_app 
           COPYrequirements.txt . 
           RUN pip install--no-cache-dir -r requirements.txt 
           COPY . .

对于不熟悉Docker的人而言，此脚本的功能如下:

导入Python 3.6.7图像
设置所有文件的工作目录
复制包含Flask、Gunicorn和运行Flask应用程序需要的所有其他文件的需求文件。

然后，通过RUN命令安装所有必要安装包，最后将所有文件从flaskdir复制到容器内的usrscrflask 应用程序中。现在只需将此文件放在相同的flask_app目录中，并添加requirements.txt即可。

flask 
     gunicorn

请记住，如果你对目录和内容感到困惑，只需在文章结尾处检查完整的项目结构，或访问GitHub存储库。

(4) 步骤3——创建Nginx文件

图源：unsplash

为运行Nginx，需要配置一些内容。但在迈出下一步之前，请在主目录内创建nginx目录(与flask_app处于同一级别)。之后，我们需要的第一个文件是nginx.conf，该文件几乎包含所有基本的Nginx信息和变量。

来看一个Nginx基本设置：

# Define the user that will own and run theNginx server 
      user  nginx; 
      # Define the number of worker processes;recommended value is the number of 
      # cores that are being used by yourserver 
      worker_processes  1; 
      # Define the location on the file systemof the error log, plus the minimum 
      # severity to log messages for 
      error_log  /var/log/nginx/error.log warn; 
      # Define the file that will store theprocess ID of the main NGINX process 
      pid        /var/run/nginx.pid; 
             # events blockdefines the parameters that affect connection processing. 
      events { 
          # Define themaximum number of simultaneous connections that can be opened by a workerproce$ 
          worker_connections  1024; 
      } 
             # http blockdefines the parameters for how NGINX should handle HTTP web traffic 
      http { 
          # Include thefile defining the list of file types that are supported by NGINX 
          include       /etc/nginx/mime.types; 
          # Define thedefault file type that is returned to the user 
          default_type  text/html; 
          # Define theformat of log messages. 
          log_format main  '$remote_addr - $remote_user [$time_local] "$request" ' 
                            '$status$body_bytes_sent "$http_referer" ' 
                            '"$http_user_agent" "$http_x_forwarded_for"'; 
                                # Define thelocation of the log of access attempts to NGINX 
          access_log  /var/log/nginx/access.log  main; 
          # Define theparameters to optimize the delivery of static content 
          sendfile        on; 
          tcp_nopush     on; 
          tcp_nodelay    on; 
          # Define thetimeout value for keep-alive connections with the client 
          keepalive_timeout  65; 
          # Define the usageof the gzip compression algorithm to reduce the amount of data to transmit 
          #gzip  on; 
          # Includeadditional parameters for virtual host(s)/server(s) 
          include/etc/nginx/conf.d/*.conf; 
      }

第二个文件——特定应用程序的配置。想要做到这一点有两种比较普遍的方法：

在/ etc /nginx / sites-available / your_project中创建一个配置文件，然后创建到/ etc /nginx / sites-enabled / your_project的符号链接。
只需在主要Nginx目录中创建一个project.conf。下述为第二种方法。

server { 
                 listen 80; 
         server_name docker_flask_gunicorn_nginx; 
                 location / { 
             proxy_pass http://flask_app:8000; 
                     # Do not change this 
             proxy_set_header Host $host; 
             proxy_set_header X-Real-IP $remote_addr; 
             proxy_set_header X-Forwarded-For$proxy_add_x_forwarded_for; 
         } 
                 location /static { 
             rewrite ^/static(.*) /$1 break; 
             root /static; 
         } 
      }

有几点需要注意：首先，请看一下listen80,该命令指定应用将在哪个端口运行。作为默认端口，我们选择80。其次，服务器名称。你可以指定从Linode获得的IP地址，也可以只使用docker映像名称。

最后，proxy pass命令，该命令应将Nginx配置指向flask项目。由于flask容器的名称为flask_app(将在后面介绍)，因此只须使用容器的名称以及Flask项目中指定的端口。

(5) 步骤4——为Nginx创建一个Docker映像

该特定Docker映像非常简单。与Flask一样，它仅包含5行，且仅执行2件事：

FROM nginx:1.15.8 
             RUN rm/etc/nginx/nginx.conf 
           COPY nginx.conf/etc/nginx/ 
           RUN rm/etc/nginx/conf.d/default.conf 
           COPY project.conf/etc/nginx/conf.d/

导入nginx图片，复制文件，并将其替换为默认文件。

(6) 步骤5——将Dockerfiles与docker-compose结合

现在已有2个Dockerfile：

一个用于Flask + Gunicorn
另一个用于Nginx。

现在是时候让它们交互，并运行整个系统了。为完成这一点，要用到docker-compose。我们只需要在主目录中创建docker-compose.yml文件。

version: '3' 
             services: 
          flask_app: 
           container_name: flask_app 
           restart: always 
           build: ./flask_app 
           ports: 
             - "8000:8000" 
           command: gunicorn -w 1 -b 0.0.0.0:8000 wsgi:server 
               nginx: 
           container_name: nginx 
           restart: always 
           build: ./nginx 
           ports: 
             - "80:80" 
           depends_on: 
             - flask_app

为了解其工作原理，我们来处理几个重要问题：

首先，docker-compose分为2部分(2个服务)：flask_app和nginx。正如从以下几行中看到的那样——flask_app容器执行运行Flask应用程序的Gunicorn，并用1个工作程序将其转换为8000端口。
第二个容器仅在80端口上运行Nginx。另外，请注意depends_on部分，该部分命令docker-compose首先启动flask_app容器，然后才是——-nginx，因为这两个容器相互依赖。

图源：unsplash

此外，还应添加一件事，以便更轻松运行此Docker设置。那就是run_docker.sh文件。

echo killing old dockerprocesses 
        docker-compose rm -fs 
             echo building dockercontainers 
        docker-compose up --build -d

该设置只是简单地运行docker-compose，但首先要确保此时旧的docker进程没有处于活动状态。

(7) 步骤6——将所有设置放在一起

当前的项目结构应如下所示：

. 
├── flask_app 
│   ├── app.py          
│   ├── wsgi.py 
│   └── Dockerfile 
├── nginx 
│   ├── nginx.conf          
│   ├── project.conf 
│   └── Dockerfile 
├── docker-compose.yml 
└── run_docker.sh

在确保一切就绪之后，就能运行docker了。

bash run_docker.sh

并通过导航到从Linode获得的IP，然后在浏览器中查看主页面：

(8) 步骤7——没有得出任何成果，我该怎么办?

先在Linode上租用一个服务器，安装docker和docker-compose，接着克隆git存储库，然后运行bash run_docker.sh。

确保成功运行后，开始更改内容。尝试使用Flask，Dockerfiles或docker-compose，直到出现故障。之后，尝试找出问题所在，并着手解决。

(9) 步骤8-下一步呢?

图源：unsplash

接下来要添加的是支持FlaskApp中的POST请求。这样，可以将请求发送到模型并获得响应。

需满足两点：一个可以处理请求的模型，以及POST请求能够自我支持。

from flask importFlask, request,jsonify 
             server =Flask(__name__) 
             defrun_request(): 
           index =int(request.json['index']) 
           list = ['red', 'green', 'blue', 'yellow', 'black'] 
           return list[index] 
             @server.route('/', methods=['GET', 'POST']) 
        defhello_world(): 
           if request.method =='GET': 
               return'The model is up and running. Send a POST request' 
           else: 
               returnrun_request()

为方便起见，在这种情况下，该模型仅返回颜色列表的第i个元素。但实际上，运行哪种模型都无关紧要，只需在所有方法上创建模型的实例(prettymuch where you have server = Flask(__name__))就可以了。

现在，如果导航到IP地址，将看到一条消息——“模型已启动，正在运行。发送POST请求”，因为只需转到IP就可将其视为GET请求。

但让我们试着使用包含模型索引的json文件发送POST请求。笔者使用Postman，但你可以视个人喜好而定(即Curl)。

行得通!现在，可以添加其它路径，以接收GET /POST请求。该想法背后的原因是可以通过加载多个模型，根据URL将请求发送到特定模型。

(10) 步骤9——进一步发展如何?

实际上，还有一个重要的步骤要做。为快速部署此Docker设置，将其部署在云空间是个不错的想法。这种方法的一个主要优势是：AWS将为群集管理基础架构提供保障。

linode

安科网

为ML模型注入灵魂：基于MVP的超简单部署方案

GodsLeft

GodsLeft

相关推荐

Flask 教程第十七章：Linux上的部署

VPS上搭建Subversion服务器手记

用了3个月阿里云的感受

linode 下mysql安装

python大佬养成计划----HTML DOM

【linode vps】搭建centos 7

技术人创业建站简略指南(Version 0.03)

前端性能优化

浅析JavaScript的事件代理和委托

Linode云服务器Xen升级至KVM全过程

GodsLeft