为ML模型注入灵魂:基于MVP的超简单部署方案
本文转载自公众号“读芯术”(ID:AI_Discovery)
开发一个出色的机器学习模型是一件棘手的事,但即使开发完成也不意味着工作的结束。在部署之前,它仍然毫无用处,他人可以轻易访问。
部署模型的方法有很多,笔者想谈一种适用于基本MVP的非常简单的解决方案——使用Flask为模型编写API,将Gunicorn用于软件服务器,将Nginx用于网站服务器,并将其包装在Docker中,以便更轻松地在其他机器(特别是AWS和GCP)上进行部署。
设置服务器
笔者更喜欢用专门为此租用的服务器,而不是使用私人或工作硬件对新配置进行实验。这样,即使某些东西被严重损毁,也无关紧要。
因此笔者建议使用Linode,笔者本人就是用其来进行实验的,它们的硬件使用感不错。只要在Ubuntu18.04 LTS上,就可以随心所欲使用其他任何服务。
这一部分适合使用Linides的人借鉴。导航到Linodes,然后单击“添加Linode”。有些东西需要填写。在发行版中,笔者建议选择Ubuntu18.04 LTS映像:
- 该区域——靠近你的区域(笔者用的是法兰克福,德国)
- Linode计划——Nanode(每月仅需5美元,就需求而言足够了)
- 根密码——你的密码
然后单击“创建”。大约几分钟后,可以转到“网络”,在这里能找到有关通过SSH访问服务器的信息。
下一步应连接服务器,并创建具有sudo特权的非根用户。这个操作背后的逻辑相当简单:你不想在服务器上把所有东西都作为根运行,因为这样更容易损坏东西。
adduser usernameusermod -aG sudousername
最终,切换到新用户。
su — username
创建应用容器
整个系统配置分为两部分:应用程序容器(Flask +Gunicorn)和Web容器(Nginx Web服务器)。
(1) 步骤0——安装Docker和Docker Compose
Docker和Docker-compose安装非常简单,分别在4行和2行内就能完成。
(2) 步骤1——创建FlaskApp和WSGI入口点
在主目录中创建flask app目录,并将以下文件放入其中。
from flask importFlask server =Flask(__name__) @server.route('/') defhello_world(): return'hello world!'
这是最基础的Flask应用,几乎没有任何功能,不用加载任何模型,不添加任何GET /POST请求和内容(这些将在下文出现)。现在,我们只有一个主页上显示着“ helloworld”的应用程序。
这部分极为简单——只需为Gunicorn创建一个在端口8000上运行的单独文件。
(3) 步骤2——为Flask创建一个Docker映像
现在,我们需要创建一个将运用这些文件的Dockerfile,并创建一个稍后能运行的映像。
FROM python:3.6.7 WORKDIRusr/src/flask_app COPYrequirements.txt . RUN pip install--no-cache-dir -r requirements.txt COPY . .
对于不熟悉Docker的人而言,此脚本的功能如下:
- 导入Python 3.6.7图像
- 设置所有文件的工作目录
- 复制包含Flask、Gunicorn和运行Flask应用程序需要的所有其他文件的需求文件。
然后,通过RUN命令安装所有必要安装包,最后将所有文件从flaskdir复制到容器内的usrscrflask 应用程序中。现在只需将此文件放在相同的flask_app目录中,并添加requirements.txt即可。
flask gunicorn
请记住,如果你对目录和内容感到困惑,只需在文章结尾处检查完整的项目结构,或访问GitHub存储库。
(4) 步骤3——创建Nginx文件
为运行Nginx,需要配置一些内容。但在迈出下一步之前,请在主目录内创建nginx目录(与flask_app处于同一级别)。之后,我们需要的第一个文件是nginx.conf,该文件几乎包含所有基本的Nginx信息和变量。
来看一个Nginx基本设置:
# Define the user that will own and run theNginx server user nginx; # Define the number of worker processes;recommended value is the number of # cores that are being used by yourserver worker_processes 1; # Define the location on the file systemof the error log, plus the minimum # severity to log messages for error_log /var/log/nginx/error.log warn; # Define the file that will store theprocess ID of the main NGINX process pid /var/run/nginx.pid; # events blockdefines the parameters that affect connection processing. events { # Define themaximum number of simultaneous connections that can be opened by a workerproce$ worker_connections 1024; } # http blockdefines the parameters for how NGINX should handle HTTP web traffic http { # Include thefile defining the list of file types that are supported by NGINX include /etc/nginx/mime.types; # Define thedefault file type that is returned to the user default_type text/html; # Define theformat of log messages. log_format main '$remote_addr - $remote_user [$time_local] "$request" ' '$status$body_bytes_sent "$http_referer" ' '"$http_user_agent" "$http_x_forwarded_for"'; # Define thelocation of the log of access attempts to NGINX access_log /var/log/nginx/access.log main; # Define theparameters to optimize the delivery of static content sendfile on; tcp_nopush on; tcp_nodelay on; # Define thetimeout value for keep-alive connections with the client keepalive_timeout 65; # Define the usageof the gzip compression algorithm to reduce the amount of data to transmit #gzip on; # Includeadditional parameters for virtual host(s)/server(s) include/etc/nginx/conf.d/*.conf; }
第二个文件——特定应用程序的配置。想要做到这一点有两种比较普遍的方法:
- 在/ etc /nginx / sites-available / your_project中创建一个配置文件,然后创建到/ etc /nginx / sites-enabled / your_project的符号链接。
- 只需在主要Nginx目录中创建一个project.conf。下述为第二种方法。
server { listen 80; server_name docker_flask_gunicorn_nginx; location / { proxy_pass http://flask_app:8000; # Do not change this proxy_set_header Host $host; proxy_set_header X-Real-IP $remote_addr; proxy_set_header X-Forwarded-For$proxy_add_x_forwarded_for; } location /static { rewrite ^/static(.*) /$1 break; root /static; } }
有几点需要注意:首先,请看一下listen80,该命令指定应用将在哪个端口运行。作为默认端口,我们选择80。其次,服务器名称。你可以指定从Linode获得的IP地址,也可以只使用docker映像名称。
最后,proxy pass命令,该命令应将Nginx配置指向flask项目。由于flask容器的名称为flask_app(将在后面介绍),因此只须使用容器的名称以及Flask项目中指定的端口。
(5) 步骤4——为Nginx创建一个Docker映像
该特定Docker映像非常简单。与Flask一样,它仅包含5行,且仅执行2件事:
FROM nginx:1.15.8 RUN rm/etc/nginx/nginx.conf COPY nginx.conf/etc/nginx/ RUN rm/etc/nginx/conf.d/default.conf COPY project.conf/etc/nginx/conf.d/
导入nginx图片,复制文件,并将其替换为默认文件。
(6) 步骤5——将Dockerfiles与docker-compose结合
现在已有2个Dockerfile:
- 一个用于Flask + Gunicorn
- 另一个用于Nginx。
现在是时候让它们交互,并运行整个系统了。为完成这一点,要用到docker-compose。我们只需要在主目录中创建docker-compose.yml文件。
version: '3' services: flask_app: container_name: flask_app restart: always build: ./flask_app ports: - "8000:8000" command: gunicorn -w 1 -b 0.0.0.0:8000 wsgi:server nginx: container_name: nginx restart: always build: ./nginx ports: - "80:80" depends_on: - flask_app
为了解其工作原理,我们来处理几个重要问题:
- 首先,docker-compose分为2部分(2个服务):flask_app和nginx。正如从以下几行中看到的那样——flask_app容器执行运行Flask应用程序的Gunicorn,并用1个工作程序将其转换为8000端口。
- 第二个容器仅在80端口上运行Nginx。另外,请注意depends_on部分,该部分命令docker-compose首先启动flask_app容器,然后才是——-nginx,因为这两个容器相互依赖。
此外,还应添加一件事,以便更轻松运行此Docker设置。那就是run_docker.sh文件。
echo killing old dockerprocesses docker-compose rm -fs echo building dockercontainers docker-compose up --build -d
该设置只是简单地运行docker-compose,但首先要确保此时旧的docker进程没有处于活动状态。
(7) 步骤6——将所有设置放在一起
当前的项目结构应如下所示:
. ├── flask_app │ ├── app.py │ ├── wsgi.py │ └── Dockerfile ├── nginx │ ├── nginx.conf │ ├── project.conf │ └── Dockerfile ├── docker-compose.yml └── run_docker.sh
在确保一切就绪之后,就能运行docker了。
bash run_docker.sh
并通过导航到从Linode获得的IP,然后在浏览器中查看主页面:
(8) 步骤7——没有得出任何成果,我该怎么办?
先在Linode上租用一个服务器,安装docker和docker-compose,接着克隆git存储库,然后运行bash run_docker.sh。
确保成功运行后,开始更改内容。尝试使用Flask,Dockerfiles或docker-compose,直到出现故障。之后,尝试找出问题所在,并着手解决。
(9) 步骤8-下一步呢?
接下来要添加的是支持FlaskApp中的POST请求。这样,可以将请求发送到模型并获得响应。
需满足两点:一个可以处理请求的模型,以及POST请求能够自我支持。
from flask importFlask, request,jsonify server =Flask(__name__) defrun_request(): index =int(request.json['index']) list = ['red', 'green', 'blue', 'yellow', 'black'] return list[index] @server.route('/', methods=['GET', 'POST']) defhello_world(): if request.method =='GET': return'The model is up and running. Send a POST request' else: returnrun_request()
为方便起见,在这种情况下,该模型仅返回颜色列表的第i个元素。但实际上,运行哪种模型都无关紧要,只需在所有方法上创建模型的实例(prettymuch where you have server = Flask(__name__))就可以了。
现在,如果导航到IP地址,将看到一条消息——“模型已启动,正在运行。发送POST请求”,因为只需转到IP就可将其视为GET请求。
但让我们试着使用包含模型索引的json文件发送POST请求。笔者使用Postman,但你可以视个人喜好而定(即Curl)。
行得通!现在,可以添加其它路径,以接收GET /POST请求。该想法背后的原因是可以通过加载多个模型,根据URL将请求发送到特定模型。
(10) 步骤9——进一步发展如何?
实际上,还有一个重要的步骤要做。为快速部署此Docker设置,将其部署在云空间是个不错的想法。这种方法的一个主要优势是:AWS将为群集管理基础架构提供保障。