实用:公有云使用常见问题解答

(1) 云主机有没有安装常规服务,大量服务、应用如何批量配置管理?

答:首选,业务放到云上并不是一切自动化了,使用云只是服务器、网络等硬件不需要投入,系统由云提供,系统之上的应用、服务还需要自己安装、配置、管理。

第二,一些常用的服务,比如LAMP,一般公有云都有专用的镜像,可以拿来就用,但是如果是自己的业务,比如游戏,公有云肯定不能提供部署好的镜像。

如果需要大规模的部署业务,可以采用以下方案:

1)申请云主机之后,利用脚本部署,这个实际上和自己在物理机上部署的过程是一样的,即将云主机当作物理机来使用,这种方案比较灵活,需要维护的是脚本,需要根据业务变化更新脚本。

2)大部分云都支持自定义镜像,就是自己搞一个模版,然后上传,载通过自己的模版克隆,这种方案比较快,但是需要维护自己的镜像,有变化需要更新镜像。

3)使用公有云的API接口,完成云主机创建、业务部署完全自动化,这种方案需要公有云提供完善的API接口,运维组目前也在开放这样的管理平台,能够将游戏业务及云主机部署的自动部署一条线打通。

(2) 公有云提供那些监控服务,自己业务在云上如何监控?

答:大部分云上的监控,都是从宿主机上看到云主机的资源占用,一般CPU、网络、磁盘资源使用可以观察的比较精确,但是内存只能看到占用多少,不能看到实际的内容到底是被缓存了还是被使用了,也不能看到SWAP的使用情况,因为从宿主机上也不能探测云主机系统内部的情况。

也有一些公有云、或者第三方服务商,比如监控宝,可以提供监控服务,但是一般都需要在云主机内部案子agent,或者通过snmp这样的协议,抓去云主机的指标信息,这样就有一个信任、安全的问题。

另外,业务指标的监控,一般还需要自己动手,比如游戏业务的人数、游戏币的消耗等,一方面要监控什么指标,自己最清楚,一方面还有保密的需求。

所以,总的来说,云上的监控还是要依靠自己,尤其是业务相关的。

(3) 云上的数据库服务RDS是否提供监控,监控类型有哪些?

RDS服务实际就是将数据库的创建、管理、快照、性能、备份、恢复等底层维护交给云管理,云只提供数据库的使用接口给用户,这样的好处是用户不需要专业的知识也可以很好的使用数据库,不用担心数据库的管理维护问题。

云上的RDS有两种实施方案:

1)直接使用云主机实例,数据库服务实际是一个特殊的云主机镜像,需要使用就是生成一台数据库云主机镜像,亚马逊目前使用的是这种方案。

亚马逊的RDS提供以下监控指标:

  • PU利用率
  • 磁盘读下IOPS
  • 磁盘读写延时
  • 磁盘队列深度
  • 磁盘读写吞吐
  • 二进制日志空间利用率
  • SWAP利用率
  • 网卡吞吐

详细情况请参考亚马逊RDS申请,使用简介。

2)使用数据库集群,用户申请数据库的时候,直接生成一个数据库实例,这种方案资源利用率更高,但是有以下难点:

  • 物理机故障的时候,故障影响面比较大;
  • 具体的实例资源使用不好控制;
  • 不同的实例要使用不同的端口;
  • 同一个数据库集群,数据库版本要求一致。

业务的数据库,为保持业务稳定,为保证业务数据机密,建议从申请符合要求的高配云主机,自己搭建数据库开始,并且敏感数据加密,数据库做好应急预案,异地备份工作,RDS可以用做备用数据库。

(4) 云上的大数据分析如何?

答:以亚马逊为例,亚马逊实际提供的是一个大数据分析环境的黑箱,申请亚马逊大数据分析集群,会自动帮助搭建好Hadoop、Hive等环境,具体可以参考亚马逊大数据服务简介。

具体的业务方面的大数据指标获取还需要自己解决,如果分析、输出结果也要依靠自己,总大来说,使用亚马逊的大数据分析服务需要有一定的大数据分析知识,有一定的门槛。

(5) 公有云有那些报警手段?

答:这个问题同第二个问题,公有云最多只能监控云主机的CPU、磁盘、网络,以亚马逊为例,能提供的报警也只能是根据这些阀值设置报警,报警方式是在控制面板提示,也可以指定将报警发送到指定邮箱。另外,还可以设置达到报警阀值动作,比如关闭、重启云主机。

但是业务方面的报警还需和自己的监控平台结合,然后定制。

(6) 公有云的API如何使用?

答:对业务自动化而言,没有api、sdk的话,也可以按照之前的物理机来操作,有API、sdk等各类接口的话,在新资源准备这一块效率会高很多。

(7) 公有云上的业务高可用如何保证?

答:业务的高可用建议从业务层面保证,而不是云的层面,原因如下:

有的公有云提供云主机的在线迁移,在线迁移实际迁移的是内存,必须云主机状态健康的情况下才能迁移,出故障的情况下是不能迁移的;

有的云提供云主机的高可用服务,即云主机在一台宿主机上宕机了,很快在另外一台宿主机行自动开机,但是这样的高可用只是系统层面的高可用,不能保证应用恢复;

所以应用层面的高可用首先要从应用的架构开始,设计架构的时候,就假定物理机或者云主机是不可靠的,当一台机器故障的时候,服务可能会降级,但是不会不可用。在申请云主机的时候,要申请冗余数量的云主机,以应对突发状况。

(8) 公有云内网流量收费吗,多个数据中心之间内网能否通讯?

相关推荐