数据仓库是为了便于多维分析和多角度展现而将数据按特定的模式进行存储所建立起来的关系型DataBase,它的数据基于OLTP源系统。数据仓库中的数据是细节的、集成的、面向主题的,以OLAP 系统的分析需求为目的。 数据仓库的架构模型包括了星型架构与雪花
星形模型和雪花模型是数据仓库中常用到的两种方式,而它们之间的对比要从四个角度来进行讨论。 雪花模型使用的是规范化数据,也就是说数据在数据库内部是组织好的,以便消除冗余,因此它能够有效地减少数据量。通过引用完整性,其业务层级和维度都将存储在数据模型之中。
现在很多公司/业务都开始重视并着手数据分析,并视为信息化建设的下一个大目标。以前收集、处理、分析数据可能是IT部门和数据库员的专属,现在很多业务都急切的开始用数据分析的思维来分析业务问题,催着IT、DBA要数据,求分析。如果企业要做数据分析,那么在诸多业务
当所有维表都直接连接到“事实表”上时,整个图解就像星星一样,故将该模型称为星型模型,如图1。星型架构是一种非正规化的结构,多维数据集的每一个维度都直接与事实表相连接,不存在渐变维度,所以数据有一定的冗余,如在地域维度表中,存在国家A省B的城市C以及国家A省
多维数据模型是最流行的数据仓库的数据模型,多维数据模型最典型的数据模式包括星型模式、雪花模式和事实星座模式,本文以实例方式展示三者的模式和区别。雪花模式示例如下图所示:。supplier_type表被进一步细分出来supplier维。数据仓库由多个主题构成
安科网(Ancii),中国第一极客网
Copyright © 2013 - 2019 Ancii.com
京ICP备18063983号-5 京公网安备11010802014868号