星型数据库(STAR Schema)

xiyouiOS

2013-06-12

关注关注

数据仓库的建立是为了某群体提供决策服务的，属于决策支持系统(Decision Support System)。

数据仓库必须满足: 1.只读的(Read Only); 2.历史的(Historical); 3. 聚合的(Aggregated);

实际中数据流动: 数据经由分段数据库到逻辑数据库最后才到数据库仓库。

Staging Layer -> Enterprise Layer -> Presentation Layer

星型数据库(STAR Schema)

对于需要高响应应付从不同地方，不同系统，不同要求的数据，一般情况下会立即存储在分段数据库(Staging Layer)，之后在做处理，这里起到一个临时表的作用。

星型数据库(STAR Schema)

经过系统的处理(process)，数据会存储于对应的逻辑数据库中。例如每一个时间段的银行的交易量都是非常大的，数据会先存在Staging，然后经过处理后存储进关系型数据库Enterprise，一般Enterprise数据库都符合第三范式。

星型数据库(STAR Schema)

数据仓库绝大部分都是归档数据(Archive Data)，很多业务流程往往不是第一时间进入数据库仓库，从而在到达数据仓库前会有一层业务数据库Enterprise Layer，所以Presentation与Enterprise是由代替键(Surrogate Key)与业务逻辑键(Natural Key)建立起联系，并且关系储存于Dimension。

星型数据库的组成: 1.事实(Fact table); 2.维(Dimension table); 一套星型数据结构，应该只有一个Fact，和多个Dimension，而每个dimension之间是没有任何联系的。

Fact的粒度应该是达到度量的最低层，例如每个货物的单价。而维度则是为划分的界限，例如想看到货物在某个时间段的价格，那么时间段就是一个维度。

因为有关系型数据库转换为星型数据库，所以某些表必然会存在冗余数据，而这正是建立的Fact与Dimension的要素。

星型数据库(STAR Schema)

关系图

星型数据库(STAR Schema)

原创文章若有转载，务请注明出处：http://www.sightcorner.com/technique/2013_06_10

大数据数据库 padding font-family

安科网

星型数据库(STAR Schema)

xiyouiOS

xiyouiOS

相关推荐

分布式文档存储数据库之MongoDB备份与恢复的实践详解

分布式文档存储数据库之MongoDB分片集群的问题

Forrester发布全栈公有云开发平台报告，腾讯云再次入选领导者象限

SAP AMDP介绍 - ABAP托管的HANA数据库过程

如何根据云服务中提取的数据来推断出用户的位置？

docker容器与宿主机的数据交互方式总结

详解Vue数据驱动原理

vue+echarts+datav大屏数据展示及实现中国地图省市县下钻功能

THINKPHP5分页数据对象处理过程解析

需要知识的后深度学习时代，如何高效自动构建知识图谱

人工智能技术如何落地交通出行？

将云技术带入数据中心-走向数据驱动型业务的旅程

联想持续发力智能物联，构建新基建时代下的行业新引擎

数据科学面试中应了解的十种机器学习概念

雾计算在物联网中的应用

AI格局正在从“数据”转变为“知识”

数据骗子无处不在，教你拆穿所谓“万金油”

模型数据出现偏差怎么办？一文了解机器学习中的7种数据偏差类型

机器学习中处理缺失值的9种方法

人工智能和机器学习如何从物联网数据中提取关键见解

xiyouiOS