企业整合NoSQL的10大要点

数据在推动企业的创新和发展,但是只是对准备好高效处理数据的企业来说是这样。

虽然关系数据库有其一席之地,但如今数据的复杂性、数量和需求让关系数据库并不适合某些应用。在许多这样的情况下,NoSQL技术的出现填补了这个空缺。不过,将NoSQL系统实施到贵企业可能并非易事。

MarkLogic的产品执行副总裁乔·帕斯夸(Joe Pasqua)表示,这值得付出精力,但是需要认真规划,并得到企业认可――这是许多IT部门忽略的一个重要方面。MarkLogic是一种与数据库模式无关的NoSQL数据库,正是它挽救了Healthcare.gov。

帕斯夸介绍了有助于将NoSQL系统顺利整合到贵企业的10大要点。

1. 确定一种使用场合。

帕斯夸表示,成功的NoSQL项目的第一步毫无秘密可言。你需要确定一种可靠的使用场合,非常清楚自己想实现什么目标。

帕斯夸说:“要不然,公司几乎注定会失败。我们在大数据领域看到了许多这样的例子。我接触过不少人,他们说需要Hadoop,要引入Hadoop。至于为何要实施或者想实现什么目标,他们却心里没谱,只不过CIO告诉他们公司需要Hadoop。进展顺利完全凭运气。他们想要紧跟潮流,但有时这种迫切的心情其实反而妨碍他们明白有什么样的业务价值。”

NoSQL对需要庞大规模和大量数据的项目来说常常是正确的选择:个性化、用户配置文件管理、从操作数据中实时提取信息、内容管理、目录、全方位洞察客户、移动应用、物联网应用、数字通信和欺诈检测。

2. 确定NoSQL模式与实施的现有数据库匹配得怎样。

一旦你搞明白了使用场合,就可以确定NoSQL是否适合自己的项目。你团队已经熟悉的现有工具可能符合要求。但是帕斯夸提醒切忌让传统工具适应NoSQL。

帕斯夸说:“我们在这个行业经常见到这种情况。他们会搞清楚使用场合,也知道想要实现什么目标。然后他们说‘让我使用现有的工具和技术试着做一下’。对于众多项目而言,尤其是需要大数据和数据敏捷性的项目,他们常常发现现有工具不管用。有时候,他们试图将这些工具用上几年,但最后不得不承认现实:这些工具不管用。”

帕斯夸表示,这正是Healthcare.gov崩溃的问题之一。服务最初建立在甲骨文数据库上,但是数据底层需要一种严谨的模式给系统带来了巨大压力。使用场合需要NoSQL模式那样的敏捷性。MarkLogic是后来被请来帮助的厂商之一。

帕斯夸补充道:“弄明白何时这些工具不适合、何时NoSQL实际上更适合解决你的问题,其实很重要。”

3. 承认NoSQL具有颠覆性。

如果你决定在自己的业务基础设施中实施NoSQL,有必要承认这个事实:NoSQL将是一股颠覆性力量,并为此作好规划。

帕斯夸说:“NoSQL具有颠覆性。它的颠覆性体现在许多方面。从开发人员的角度来看,人们希望使用现有的工具和技术。如果他们决定想要换一种做法,对于如何构建应用程序、使用数据库已有一套完整想法。想照搬这个经验,试图让NoSQL以同样的方式工作,这很自然。但实则不是。如果他们试图像SQL那样使用NoSQL,最后以失败告终。你要退后一步,考虑实际使用NoSQL的正确方式。别试图与之抗争,让它成为关系数据库。这是新的模式,它是一种颠覆性模式,我们要充分利用它。”

帕斯夸表示,比如说,传统的经验法则是,针对你拥有的任何重大应用程序,都要有一大批数据库管理员(DBA)。可是他特别指出,换成NoSQL,他通常在之前可能有10个数据库管理员的情况下只看到一个数据库管理员。你可以解放那些员工,派他们干别的事情。

成本模型也会改变。NoSQL是一种横向扩展、基于商品化硬件的技术。

帕斯夸说:“你购买NoSQL的方式、使用NoSQL的方式其实全然不同。你可以购买经济高效的硬件,需要时可以扩展。这其实影响了采购流程。你无需事先购买1000万美元或2000万美元的硬件,它让你可以很快完成采购周期。这方面做得很好的人充分利用了这个优点。”

4. 从小处入手,然后加大力度

如果是关系数据库技术,很难从小处入手。如果你是家大公司,已拥有成千上万客户(可能是个人或其他公司),就会经常面临这一挑战:处理数据方面的许多不同政策,或者整合收购的另一家公司的数据。

帕斯夸说:“你需要把来自不同数据孤岛的庞大数据整合起来,而且要求越来越高。”

使用关系数据库技术解决这些数据孤岛问题意味着,你得分清想要从中整合数据的所有不同孤岛,要创建一种协调这些数据的模式,并开发和部署ETL流程,把所有这些数据集中起来。整个过程可能需要几个月甚至更久。

帕斯夸说:“然后,就在你看到大功即将告成之际,你开发了一种新产品、收购了一家新公司,或面临新的监管要求,于是又回到了起点。必须事先做好所有的数据建模工作。”

NoSQL拥有横向扩展、基于商品化硬件的架构和模式方面的灵活性,这意味着你可以针对一些数据从小处入手,必要时扩大力度。帕斯夸表示,你可以从杂乱的非结构化数据入手,立即从中获得价值,然后必要时逐渐添加结构。

5. 找出企业中的决策者和实施者。

这不是NoSQL项目特有的环节。应对颠覆性变革时,变革管理可能是你的较大障碍。

帕斯夸说:“要是没有决策者,你将不知所措。但是你还得有实施者。”

实施的具体细节可能关系到你项目的成败,所以你的团队中有人懂得实施技术很重要。

6. 找出阻碍和支持项目的流程。

有必要在NoSQL世界下重新考虑你的流程。惰性可能是你面临的较大障碍之一。

帕斯夸说:“人们希望保持现状,天生渴望始终以同样的方式来做事,如果你不改变任何流程,这会阻碍进展。”

明白使用场合以及这项新技术带来的颠覆性变化,这让你得以设计充分利用新功能的流程。关键的架构师和技术领导者会帮助你敲定那些流程,并让所在部门积极支持。

7. 明确你是否拥有合适的技能。

帕斯夸表示,拥有修改应用程序设计过程和系统应用程序架构以适应NoSQl的技能很重要。

他说:“拥有合适的技能很重要。这倒不是说NoSQL特别复杂。实际上,它通常更简单,但是不一样。许多人在数据库行业摸爬滚打了30年,他们曾经用过的数据库就是关系数据库。他们学习NoSQL没有任何困难,但是确实要花时间。”

培训是整个流程的一个重要部分。帕斯夸特别指出,MarkLogic免费提供所有培训,无论你是不是它的客户。

8. 评估对NoSQL DBMS和查询语言有多了解。

确保评估一下贵企业对NoSQL及其使用有多了解。

帕斯夸说:“你已拥有的人都是聪明的数据库人才。他们理解NoSQL不会有任何问题。从技术角度看,这并非不可逾越的问题。它主要还是个文化问题。”

9. 营造一种紧迫感。

帮助所有的利益相关者明白为什么需要实施NoSQL、他们有望获得什么样的回报。

如果你求助于NoSQL,贵企业的人员很可能已经面临最后期限,看不到未来方向。

帕斯夸说:“这些人通常面临问题――大数据和数据集成,他们已经在苦思冥想,试图用现有工具来解决问题,他们在这方面耗费了大量时间。他们已经感受到了时间的压力,因为他们在死胡同上浪费了太多时间。我们面临的挑战就是,让利益相关者有这样一种紧迫感。”

帕斯夸表示,业务部门可能想着一些以业务为导向或者以监管为导向的最后期限。你要确保,技术人员和负责采购的人员对于这个最后期限有一种合适的紧迫感。

他说:“从小处入手,迅速起步,逐渐加大力度。并将这个意思传达给所有利益相关者。”

10. 依赖那些有经验的人,包括同行和顾问。

帕斯夸表示,经验至关重要。

帕斯夸说:“由于MarkLogic之类的技术确实具有颠覆性,很容易掉入一些陷阱。能够走出去,结识用过这些新技术并从中得益的人,并与他们共事,这非常重要。如果某人在用MarkLogic,他们用它来运行银行系统或作为培训系统的一部分。Healthcare.gov用它来运行交换中心。其实,你能做的最棒的事情之一是,走出去,与那些用过的人多交流。从技术方面、文化方面和流程方面与对方交流一番。搞清楚你在本企业如何才能最有效地利用这项技术。”

帕斯夸表示,如果你确实请来第三方顾问,就要寻求专业服务,它们有能力请来架构师和顾问,帮助你的人员取得良好的开端。他表示,就自力更生而言,这远比寻求请来后永远跟随你的专业服务强得多。

相关推荐