Storm中的基本概念

Storm中的一些基本概念

Storm:分布式、高容错的实时计算系统。

Topology:拓扑,相当于hadoop中的job,但没有严格的指定开始时间与结束时间。

Spout:Topology中的输入数据流,连接数据源,将各类数据源转换成tuple结构的数据,并序列化,向Bolt输出转化后的数据流。

Bolt:接收Spout的数据流并计算,记录计算结果,并向下一个已订阅的bolt发射结果。

Tuple:storm中的数据结果,key-value格式的列表。

Nimbus:是Storm集群中的主节点(masternode)的守护进程,负责在集群里面分发代码,分配工作给机器,并且监控Topology的运行状态。

Supervisor:是Storm集群中的工作节点(workernode)的守护进程,每一个工作节点上面均会运行一个supervisor,它会监听本台机器的工作状态,并根据需要启动/关闭工作进程。

相关推荐