海云捷迅的教育云实战经验分享

在互联网时代,大数据、云计算、移动化、社交网络、物联网等新技术层出不穷,对教育信息化应用也产生了重大影响,大数据学习分析、教育云、HPC、移动教育等应用逐渐成为教育行业的热点。

然而,教育系统对于信息化的认识仍然离互联网时代的创新还有很大差距,特别是校园网络一般基于传统 IP 技术,仅仅只是对校园信息化起支撑作用,这是远远不够的。

以 OpenStack 为代表的云计算等新技术的深入应用,将实现优质资源的整合与共享。资源的整合与共享一直以来都是教育信息化的主旨,云计算从技术优势上提供了全方位资源运用、共享管理的基础环境。

云计算数据中心的构建使得教育主体更加专注于教育业务本身,减少信息系统选择、规划、建设等工作;云计算跨平台环境使得复杂的设备管理变得统一简单,个性化、异构的信息系统需求得以保证,知识的产生、加工、传输、缓存数据安全更具保障。

未来,教育信息化领域的大容量资源调度管理、网络设备运营管理、大规模服务器资源统一管理提出了全新的要求,以云计算、OpenStack 为基础的大规模云管理平台、PB 级云存储的管理应用将成为各级别学校信息中心进行 IT 建设的实施重点。

海云捷迅结合我国教育系统信息化所面临的挑战,通过多年在各学校内的实践积累并整合了现有 OpenStack 云计算架构的功能模型,针对我国教育系统开发了教育云解决方案,可为高等院校和区域内初中等教育机构及相关方的业务需求提供云化支撑。

海云捷迅武汉大学案例

一. 项目背景

在教育信息化平台建设中,武汉大学在基础设施的建设、软硬件设备的购置上,投入了大量的人力财力,在一定程度上促进了教育资源共享,提高了信息化教学环境和管理水平。而随着武汉大学教学改革的深入,越来越重视学生的个性化需求。完全学分制、创新教育、网络公开课等新的管理和教学形式的引入,对武汉大学的教育信息化平台建设提出了新的要求。“互联网+”的提出,云计算、大数据、移动计算等技术的出现,为解决此问题提供了新的技术途径和模式,云计算又是其中的核心和基础。

云计算的一个重要特点就是面向服务。云计算安全联盟(Cloud Security Alliance)曾指出了云计算的本质,云计算是一种服务提供模型,通过该模型用户可不受时空的限制,根据自身需要,通过网络选择资源池中的共享资源;同时这些资源的分配是动态的和弹性的,可以在不同用户之间灵活划分。

二. 项目需求

目前,武汉大学教育信息化平台建设取得了长足的进展。校园网、在线教育平台的普及等,提高了教育资源的共享和利用率,促进了高校管理手段和教学方式的变革。但这其中暴露出的一些问题也不容忽视,关系着武汉大学教育信息化平台的可持续发展。

1、软硬件设施分散,管理维护成本高

武汉大学的各二级院系在信息化平台的建设中,一般会自购硬件设备和相应的教学软件,比如服务器、在线教学平台等。为了保证兼容性和稳定性,一台服务器上通常只运行 1 到 2 个应用,硬件资源的利用率不高。有些教学软件在功能上具有通用性,但仅供院系内部使用,软件资源的共享性也不足。同时,机房为了满足不同的教学需求,在每台机器上都安装了大量的软件。为了维护软硬件资源的正常运行,每个院系都需要安排专门的人员进行管理,工作量较大,效率较低。

2、信息化教学资源日新月异,现有设施更新速度慢

随着信息化教学的深入开展,数字化学习资源越来越丰富。网络公开课、微课等教学模式的涌现,对于软硬件水平提出了更高的要求。比如在网络公开课建设和运行中,会存储大量的教学视频和各类学习资源,学习者对服务器会产生大规模的并发数据访问,网络公开课平台会实时动态生成大量的学习和统计数据。

这就需要服务器等硬件设施具备更高数据处理能力,网络设备具备较高的数据吞吐量等。而二级院系现有的设备,通常已经运行多年,由于当初设计和自然损耗等原因,已不能跟上最新的需求。若独自更新相关软硬件,则需经历新一段规划与建设周期,耗时较长。

3、安全需求

随着教育信息化建设的推进,应用系统越建越多,但由于意识、技术和资金等方面的原因,网站被黑、应用瘫痪、数据泄露或被篡改等情况时有发生,安全问题较为突出。

4、并发需求

武汉大学全日制在校生超过 5 万人,其中本科生 3 万余人。这意味着每学期有 3 万余本科生进行网上选课;每年有 2 万余人报考研究生;同时,高考招生网上宣传与咨询量也非常大。这三个应用访问高峰的时间段也各不相同。

针对这些对并发量以及实时要求高的应用,提供应用的部门包括教务部、研究生院和招生就业处分别购买了性能较高的服务器,有的还使用了多台,通过 DNS 轮询解析的方式进行负载均衡,尝试保证请求的实时响应。但是,DNS 轮询解析并不能真正做到负载均衡,应用效果不好。另一个方面,这些高性能服务器大部分时间处于空闲状态,只是在特定的时间段发挥作用,设备利用率极低。

5、管理水平参差不齐、专业化不足

在教育信息化平台管理中,有些高校的二级学院没有配备专门的技术管理人员,而是由相关行政人员或专业教师兼为管理。而这些非专门技术人员,对平台软硬件的日常维护,停留在服务器的启停、后台数据的备份等功能性维护上,而对于性能优化、运行安全、负载均衡等专业技术层面的维护往往不足,导致平台在长时间运行后,出现反应迟缓、系统宕机等问题。

为了解决以上问题,武汉大学网络中心在 2012 年初,利用云计算技术,采用成熟的云计算软硬件产品,结合学校自身的特点和实际需求,搭建了共享服务器群---武汉大学云平台,作为全校信息化基础设施共享平台的重要组成部分。武汉大学共享服务器群充分发挥了网络中心技术和机房条件的优势,提高设备利用率,实现资源共享,满足校内各学院和全校师生不同层次和不同角色的服务需求。

三. 解决方案

武汉大学云平台采用多集群架构设计,由 50 台 x86 服务器构建的 OpenStack 云集群 1、26 台使用本地存储服务器构建 OpenStack 云集群 2,以及 22 台使用集中存储服务器所构建的开源云计算实验室。其中,OpenStack 云集群 1 包含整个云平台的管理节点和高配云服务器节点(采用 SSD+SAS 磁盘结合的方式,提供高速 IOPS 存储池 1),用于承载武汉大学的核心业务;OpenStack 集群 2 包含低配服务器节点(使用 SATA 磁盘,提供低速 IOPS 存储池 2),用于提供武汉大学部分学生的开发和测试环境;OpenStack 集群 1 和 2 共同构建了武汉大学的核心业务云平台,通过集成学校现有的统一身份认证和短信平台,实现资源的统一调度和管理。通过将服务器和存储按照硬件性能进行分组,可为武汉大学不同类型的业务提供不同磁盘性能的资源,并可方便管理员在管理 Portal 上进行调配;可在云平台中部署 swift 组件,用于对虚拟机和重要的业务数据进行备份。

海云捷迅的教育云实战经验分享

图 武汉大学云平台架构

武汉大学云平台架构分数据中心区、网络区、用户区三部分

1、数据中心区

数据中心区是云平台的核心区域,用于承载武汉大学各院系网站、选课系统、招生系统等核心业务,所有业务的数据文件均存放在此区域中。

数据中心区提供用户认证、用户数据管理、备份;以及各种安全措施的部署,如更新和修补程序等,并支持 IT 运维人员进行统一部署和维护。

2、网络区

用于连通前端师生的终端设备和数据中心,优质的网络带宽是使用云服务的基础,图形图像及各种应用的使用,均需要高质量网络带宽的保证。

3、用户区

包括武汉大学内各院系师生集中办公和学习的区域、校外互联网访问用户等,用户可通过台式机、移动设备等多种终端以 B/S 方式访问云平台,以获取相关的资源。

武汉大学云平台具备以下特点和优势:

1、可随时随地访问

凭学(工)号登录校园信息门户网站,即可直接访问云平台,无需二次输入用户名及密码。

2、短信提醒

云平台的任何关键操作或重要信息,比如注册成功、续费提示、资源告警,能够自动发送给管理员或普通用户,短信内容支持自定义,保障云平台交互操作一目了然,云平台维护更及时。

3、快速部署

云平台的计算、存储资源池需要按需快速扩展时,方案可满足资源使用者的需求能够被快速响应和满足。云平台通过自动化部署手段实现了 IT 资源的快速交付,可实现云平台 2 小时内快速部署,大大提升快速扩展的能力且降低了因为长时间部署调试带来的隐性资本损耗。

4、数据安全

武汉大学的所有业务数据完全驻留在云平台内,存储设备采用分布式架构,确保在单台存储设备意外崩溃时数据的零丢失,保证了所有业务数据的数据安全性。同时,可通过搭建 swift 组件构建数据备份资源池,针对整个云平台中关键数据进行备份。

5、降低运维管理难度和成本

传统云架构建设时包含:虚拟化服务器、光纤交换机、磁盘阵列、虚拟化软件、云管理套件等,往往选用不同厂家的软硬件设备,且硬件层次关系比较复杂,在维护时需要考虑的因素比较多,维护难度较大,而本方案中的云平台架构因为采用横向设计的分层架构,无太多的硬件依赖关系,因此后期的可维护性更强,可以大大降低武汉大学的运维成本。

6、比传统云架构更高的性能

本方案推荐的基于 OpenStack 的云平台架构比传统云架构具有更高的性能。传统云架构仅仅是在计算层面实现虚拟化,虚拟机的性能难以保障,难以支撑更大的业务系统 IO,所以无法满足客户对于资源多样化的需求以及保障客户云服务 QoS。传统云架构的多台虚拟化服务器在底层还是对应于单点的 NAS/SAN 共享存储,因此系统的性能瓶颈在于底层存储无法提供足够的 IO 能力。云平台通过完全分布式的存储架构实现数据多通路高并发;通过 SSD 和 SATA 自动分层存储机制实现数据访问 IO 的大幅提升,单虚拟机读 IO 可达 3 万+,写 IO 可达 2.5 万+,是传统架构的十倍量级;而且通过针对于虚拟化设计的诸多软件定义的其他技术机制在多层面保障系统的高性能。

7、更好的扩展性

本方案推荐的云平台架构具备更好的可扩展性。传统云架构底层采用共享存储设备,共享存储设备的扩展性受限于其控制单元,即主机头,主机头的主机接口和带宽是有限的,未来随着业务发展,数据量不断增加,存储单元的扩展必然伴随着存储性能的下降。云平台由于采用超融合架构,每个节点机里都包含数据控制单元和数据存储单元,且各节点机地位对等,需要扩展时仅仅需要添置节点机即可,新添置的节点机和原有节点机构成新的集群,在容量扩充的同时系统整体性能是线性增加的,因此本方案中的云平台可扩展性更强。

8、更高的可靠性和可用性

传统云架构底层采用单点的共享存储(Share Disk),当存储系统出现故障时对于整个系统而言是巨大灾难。本方案中云平台架构的存储层面采用分布式架构,在数据保护层面采用多数据副本机制,因此,集群中任意一个节点损坏都不会对整体造成影响,这样可以保障系统的高可靠性,而且系统具备数据副本自动恢复的相关机制以保障数据安全可靠。整个系统在各个层面都充分考虑了高可用架构,包括网络链路、完全分布式架构、存储管理、云管理架构等,这样可以确保系统构成单元在单点出现故障时不会造成上层业务的中断而给用户带来不可用的体验,保障业务系统持续的可用性。

四. 客户收益

武汉大学云平台,能有效利用武汉大学现有软硬件设备,通过虚拟化技术统一建设和管理,充分发掘基础设施的潜能。使用者可按需申请服务,合理利用资源。云计算的大规模分布式计算能力,能为海量服务请求提供稳定高效的支持,能适应武汉大学信息网络部门、各二级学院、老师与学生等不同层次和不同角色的服务需求,在降低成本的基础上,充分提高资源的利用率和共享率,促进管理水平的专业化。

1、用户使用角度,共享服务器群具有用户自服务功能,用户自行注册,按需提交资源使用申请,系统管理员审核通过后,管理平台自动根据配置生成虚拟服务器。用户通过自服务门户实现资源的管理、使用及自运维,包括资源生命周期管理、网络管理、虚拟磁盘(云硬盘)等,无需要管理员的干预。

2、从高并发需求角度,共享服务器群利用同期规划的负载均衡设备,很好地支撑了学校的教学和管理工作。以本科生选课为例:武汉大学共有本科生 3 万余人,选课在网上进行,每次网上选课时间为两天,是很典型的高并发实时访问的活动之一。在实现共享服务器群之前,每次开放学生网上选课,教务部服务器最大能够承载的并发不到 2000 人,导致学生无法正常选课;教务部选课系统部署到共享服务器群上以后,已承担多次全校本科生选课,最大选课并发访问接近一万人。

3、从运维管理角度,通过共享服务器群管理平台,实现了计算资源、存储资源、网络资源的集中管理和统一调度,实现了自动化的运维监控,极大的提升了运维效率。

4、从安全角度,共享服务器群提供了三重安全措施,一是网络硬件防火墙,提供物理级别的保护;二是软件防火墙,提供用户级别的隔离防护;三是应用防火墙,提供应用级别的防护,保证业务系统的安全。

相关推荐