电信网管中的推拿之术

最近去interview,谈到配置管理,忽然发现以前忽略的一个小问题:

EMS将配置是推(push)给网元还是从网元上拿(synchronize,pull)?很像push/pull老问题

我做过的两个系统都是从设备上拿!这最符合产品的开发思路。一般公司都是先开发设备,从硬件到CLI,后面才想起来SNMP等做EMS甚至NMS。所以单兵作战时代的设备要自己管理配置。后面的EMS也理所当然的充当CLI的GUI,所有的配置还是保存在设备上。这时候同步必须满足以下场景:

1.EMS启动后要同步

2.设备重启后

3.设备断线后

4.设备的本地维护终端有操作后

5.一些特殊的设备事件

换个角度看问题,如果我们是可怜的客户,买了几个厂家的设备,每个EPON厂家有自己的EMS,而电信领导要大发慈悲,所有用户免费从2M带宽升级到4M(举个例子,可能性微乎其微)。怎么办呢?赶快去操作每个厂商的EMS,把QOS下发下去,运气好的用批量操作一次搞定。北向接口?费时费力。

如果电信推出类似于LDAP的管理配置树,要求设备厂商必须从这里去读取配置,不管你是FTTB还是FTTH,每个用户的状态,速率,ACL等都保存在里面。这样EMS等就必须去把配置从运营商那里同步回来,根据业务要求下发到FTTB的端口上或者FTTH的ONU上。而设备上的配置不再变得重要。再有来自底层的擅自修改,应该是个告警。这里要注意几个问题:

1.底层和上层管理者之间的配置同步,应该是基于版本标记的,或者利用版本差异来传输来减少数据量。

2.事务!这个时候的配置一定要保证完整性

YY结束