[翻译]无敌Hadoop(MapR 版本)
转发:http://www.mapr.com/blog/lights-out-data-center-ready-hadoop?mkt_tok=3RkMMJWWfF9wsRonuqzIZKXonjHpfsX56%2BQkWqG0lMI%2F0ER3fOvrPUfGjI4ATcRhI%2FqLAzICFpZo2FFVG%2FCH
这是什么意思“数据中心准备关灯了”吗?这意味着,任何故障,无论是硬件,软件或用户错误不需要通过管理员操作。通常管理员可以访问的数据中心,并进行维护,现在是常规,而不是紧急情况。如购物车磁盘已满,管理员可以随时更换硬盘。
在与客户的讨论,这是立即明确表示,他们是Hadoop的高可用性的各种描述相混淆。我个人最喜欢的是另一家厂商的描述他们会提供“热手动故障转移”。咦?手动故障转移过程中是如何“热”?-当集群不可用?这是最大的矛盾,因为“高可用性-而不是指”业务连续性。至少是从后者显然,它不是真的高可用。
相比之下,MapR已专门设计的高可用性是唯一的Hadoop的分布无单点故障。其他发行版本使用单一NameNode,该NameNode的节点出现故障时,整个集群变得不可用,你丢失数据。NameNode的功能有了MapR,分布在集群。从某种意义上讲,所以没有数据丢失或停机,甚至在面对多个磁盘或节点故障,MapR有一个“无NameNode的”架构。
当我们谈论高可用性,我们谈论的自动化,状态故障转移所有的软件和硬件错误。自动数据重新复制,意味着你的系统将通过没有问题的任何错误。MapR的滚动升级,保证高可用性,在例行的硬件和软件维护。
还内置MapR镜像和快照-旨在有效地保持数据的完整性和业务连续性,跨集群和网站的功能完整的数据保护。这是重要的,因为复制其他使用Hadoop的分布并不防止用户或应用程序在集群复制,但与MapR得到充分保护您的错误。MapR使得容易保护数据,您将体验零写在快照原始性能损失,PB的快照可以在短短几秒钟。
因此,当考虑为Hadoop的高可用性确保获得完整的架构,然后你可以放心地关灯。