两位大佬耗时三年终成数据架构 大数据、数据仓库以及Data Vault
有关大数据的说法很容易让人们在理解大数据的现实性和可能性时迷失方向。本篇着眼于大数据是如何适用于决策领域的。本篇从如下几个重要的视角进行思考:当前企业是如何进行决策的,企业应该如何进行决策,以及在大数据条件下如何进行决策。
本篇主要涵盖了以下几个主题。
企业数据
企业数据是指整个企业的信息全景。在企业中有很多种不同类型的数据。本书展示了一种数据视角,并且在很高的层次上阐述了如何在企业决策过程中使用(或者不使用)数据。
大数据
讲述了大数据是什么,以及它能够如何增强企业的决策。大数据有几种不同的定义。本书采用了一种非常务实的大数据观点,然后讨论了它的-些突出特点。大数据最明显却并未被技术供应商所提起的-个特征是重复型大数据和非重复型大数据之间的差异性。
重复型大数据和非重复型大数据之间深刻的差别也称作“分界线”。本书之所以值得,正是因为通过阅读本书你可以很容易地理解这条“分界线”,而且本书对企业决策能力也有所启示。
数据仓库
数据仓库面向企业数据完整性方面的需求。总有一天, 企业会开始领悟到这样的事实:拥有数据和拥有可信的数据并不是一回事。他们醒悟之后意识到了“数据完整性”的意义。这个时候,企业级数据仓库( enterprise data warehouse, EDW)诞生了。有了EDW,企业可以利用其中的基础数据制定重要.可信的决策。在EDW出现之前,企业已经有了大量的数据,但这些并不是可信的数据。
Data Vault
Data Vault面向管理随时间推移而发生数据变更的需求。数据仓库会随着时间推移而不断演化,这最终形成了一种名为Data Vault的学科和结构。不论过去还是现在,都有多种原因采用Data Vault作为具有完整性需求的系统的主干。
业务系统
业务系统面向企业日常业务运作方面的需求。由于管理超大规模数据量和数据完整性方面的需求,需要一些能够运行和增强组织日常业务的系统(今后也一直需要)。
架构
架构是指如何以一种整体而内聚的方式将不同类型的数据和不同类型的数据需求组织到一起。认识企业中各种数据视角的不同需求是一回事,而设想如何以一种整体而内聚的方式将不同类型的数据组织到一起则是另外一回事。
通过阅读本书,你会了解如何将企业中所有形式的数据组合到一起。本书旨在提供一个关于企业全部数据的高层次、全方位的视图,并且介绍如何使不同的数据形式以建设性的方式相互协作。
大家如果需要这篇【数据架构大数据、数据仓库以及Data Vault】技术文档的话,就可以直接转发此文关注小编之后,私信小编“学习”来得到获取方式吧!
从本质上讲,数据架构与建筑架构并无二致。没有良好定义的架构,就难以支撑起数据的捕获、计算、分析和管理运维等各个环节,更不用说管理和使用海量数据了。
为什么我们的数据总是难以集成和交换?为什么我们的信息系统总是不够可靠,生命周期是那么短暂?为什么我们难以从数据中分析挖掘出业务价值?关键就在于我们在数据架构设计上投人的精力太少,总是草草地完成(甚至是跳过)设计阶段的工作,急匆匆地进人实施阶段,而忽略了数据的本质特性。
“大数据”的概念出现之后,在一种急功近利的狂躁情绪的牵引下,在商业包装和媒体炒作的推动下,在信息化的很多角落里,很多人正在试图将原来的“小垃圾桶”换成新的“大垃圾桶";但是,真正从大数据技术中获益的人要远少于宣传大数据的人,而且“大数据"这个词实际上正面临着滥用的危险。
在我们的各种数据标准尚不够完善之时,在我们的数据架构仍然存在短板之时,我们的大数据走不了多远。在静下心来读完这篇之后,相信你对此会有更为深刻的体会,不会再被各种有关大数据的华丽辞藻和神话传说迷住双眼。