从狭义SDN到广义SDN,网络自动化趋势下的SDN
SDN的内涵与外延
软件定义网络(Software-Defined Networking)概述
SDN的概念主要体现的是技术架构视角,强调的是实现网络设备的软件硬件解耦、网络系统的控制面与转发面解耦,以及整体全面的可编程性。SDN的优势在于它是基于系统全局信息进行网络转发等的策略决策的,实现了网络管控模式从设备层面转向系统层面,提供了网络运维自动化统一的配置和控制接口,从而能够更好地实现对云计算业务的敏捷部署、变更、扩展的支撑。
狭义地讲,SDN系统主要由转发面和控制器构成。转发面可以是Underlay物理网络和/或Overlay虚拟网络,场景可以是数据中心Fabric、WAN、资源池或者边缘服务等。SDN控制器由平台和各种应用构成,平台应基于实时内存分布式数据存储实现对系统全局配置和状态信息的管理,支持事件注册和发布机制,提供基本的二层交换、三层路由、策略规则、网络拓扑以及状态统计等功能;应用则主要包括网络互联、安全隔离、网络服务、SLA以及网络监控分析等。开源项目ONOS和AT&T主导的CORD项目就是SDN平台与应用的典型样板。广义地讲,SDN这个概念涵盖了目前和未来各种网络相关的新的技术、产品、方案。而在SDN具体实施和推进过程中,应该关注的除了SDN本身的架构优势外,更多的是SDN系统整体的可编程能力所能带来的对业务部署、运行、变更的自动化、可靠性、敏捷性的支持。
关于基于意图的网络
IBN(Intent-Based Networking)的概念主要强调的是业务驱动视角。意图是用户对系统的输入,其目标是将业务意图转变为网络配置;并且在整个运行过程中通过数据采集与分析了解网络的状态,并进行相应的闭环动态调整以确保系统的实际行为与业务意图相一致。IBN系统主要由意图的解析与验证、自动化下发、网络状态的掌握、动态调整和优化等方面构成。我们可以认为SDN是一种IBN的实现模式,或者说SDN是实现IBN的一种典型架构。IBN厂家Apstra的AOS的典型应用场景就是针对整个数据中心Fabric的自动化管控。
关于网络自动化
随着网络规模扩展,系统越来越复杂,手工模式的网络运维已不能满足要求。网络自动化(Network Automation)主要是从运维的角度通过利用各种商业化的、开源的和基于脚本的工具,实现网络在任务层面、网络服务层面以及业务服务层面的配置等操作的自动化。只有这样才有可能将以往长时间以每月为周期的大的网络配置变更转变为以每天为周期的经常性的小的变更,才能够实现系统中各种冗余组件常规性的在线切换与运行等。而SDN控制器则是网络自动化系统实现的核心环节。
SDN的发展动向
在各种新生的数字化经济蓬勃发展的背景下,不论是企业的IT基础设施还是云计算网络等都处于一个不断发展、演进的过程中,在系统规划设计、实施升级过程中就要充分考虑这个因素。而实际上对SDN技术与应用发展动向的预测与把握本身也是一个持续迭代的过程。
业务驱动
SDN的核心价值体现在支撑业务需求、提升企业竞争力。新的网络技术的应用首先应聚焦对业务运行产生实际效果。应关注业务网络如何支持服务拓扑,网络配置如何更好地与业务意图对齐,以及如何更好地支持应用交付、提升应用性能。网络架构要适应业务的动态变化、提升更好的客户服务体验、和支持各种不同的业务模型和流程,以及适应企业混合云模式的发展。除了功能、性能、容量外,网络技术的创新要让网络运维操作更简单化、自动化,要能够支持企业IT云计算及网络系统的成本模型逐步从“采购并管理”模式向“随增长而付费”模式的转变。
边缘计算支持IoT和5G
随着云计算需求的迅速增长,WAN边缘应用越来越广泛,SD-WAN架构与实现依然会快速演进。LAN边缘接入也需要能够支持各种IoT类型和海量设备。而伴随5G技术与应用的发展,基于标准x86服务器和网络功能虚拟化NFV的边缘(Edge)解决方案逐步成为企业远程分支和Overlay网络服务的主流,以适应对性能、灵活性、成本的要求。
混合云Overlay网络架构
SDN网络架构的发展需要能够在Underlay物理网络的专线和VPN等互联的基础之上,主要在Overlay层面进一步实现私有云与公有云之间的网络互联、安全隔离、网络服务、SLA保证、与监控分析等功能。通过与云管平台的相关对象信息同步,实现在IaaS层面的OpenStack、vSphere、2Cloud、ZStack等和PaaS层面的K8S等之间同构或异构的便捷对接。提供开放标准的API支持实现按业务意图的自动化网络服务编排。
智能分析闭环控制
在新的SDN网络模式下,底层数据采集将成为标准配置,包括物理设备的INT(In-band Network Telemetry)和软件代理的部署。通过对时间序列数据流的综合分析观察网络状态的变化。采用大数据技术实现网络行为的智能分析,通过网络行为的学习改进网络运维,通过采集更有效的数据改进网络行为的学习。云网分析不只是静态模式,还要实现动态模式,要能够判断网络转发性能与业务处理性能的关联。监控手段不只是针对设备层面的,而是覆盖系统的各个方面。通过监控系统与网络管控形成的闭环实现各个层面的自动报警和动态调整以确保网络运行遵循业务策略意图,以及系统整体范围内的故障定位。云网分析需要在网络与系统的总体实施过程中统筹规划、设计、部署。
网络运维自动化
在整个企业IT范围内包含了各种自动化管理系统和工具,服务器生命周期自动化、持续配置自动化、客户与设备管理自动化、应用发布自动化、云管理自动化、IT流程自动化等。ONAP是电信领域比较典型的软件定义数据中心SDDC的自动化管理方案,腾讯的蓝鲸包括了SRE的相应功能实现,Ansible是目前流行的开源自动化部署工具。
传统的网络运维很多是基于CLI手工逐次对网络设备进行配置的,这种方式是运维过程中人为故障的主要原因之一。SDN模式下将更多地利用各种自动化工具,通过与云管平台、SRE的集成对接,在系统整体层面上进行网络的配置与变更、监控可视化、故障诊断、网络扩展升级等。从而使运维操作更加简单、可靠,当然这是以相应软件工具实现的复杂性和功能内聚等为基础的。运维人员的工作重点将更多转向API驱动的网络自动化工具的应用上,特别是通过API层面的集成实现相应的定制化系统解决方案。如何利用好API实现网络自动化的系统集成将替代CLI操作成为对运维人员的基本技能要求。
生态解决方案
随着SDN系统更加模块化的结构发展,更多小而精的组件会逐步取代大而全的产品。而这些小而精的组件也越来越内聚了更多更完备的功能。同时系统模块间的协调配合也更加密切、更加多样化,能够实现更加有效的定制化、精细化操作。网络功能的升级也更加敏捷以支持相应的创新业务的需求。
实现此目标的基础是对底层网络设备、控制器平台、控制器应用等的抽象,包括功能的抽象、流程的抽象、接口的抽象、配置的抽象等。进一步实现模块间接口的标准化,这样在网络硬件或软件模块升级或替换过程中,只要操作接口保持稳定就能保证平滑的系统演进和业务迁移。而标准化的API驱动组件机制也可以屏蔽厂商特定的接口与上层编排工具等的差异,更好地规避厂商锁定问题。这样在SDN系统的实施过程中,企业可以根据业务的需求采用相应的厂商产品、标准硬件白盒设备、开源软件等,有效地形成整体的SDN生态解决方案。
如何利用SDN技术推进网络部署与运维的自动化,提高网络变更、升级的敏捷性以适应新生数字经济各种业务与服务的发展,要求在SDN系统咨询、实施过程中对SDN技术架构、行业厂商、开源平台与应用软件等有全面的把握,这将是对SDN厂商价值体现的挑战和机遇。