简述Oracle数据仓库的体系结构
Oracle数据仓库的体系结构可以分成三个层次:
数据获取层:Oracle Database Enterprise ETL Option + Oracle Database Data Quality Option 在Oracle Database 10g 同一个软件中实现了从数据模型设计,数据质量管理,ETL 流程设计和元数据管理的全部功能。所有的 ETL 过程可以通过Oracle数据仓库中提供的工具: Oracle Warehouse Builder 生成的ETL 脚本存储在Oracle 10g 数据库中执行,按照数据仓库系统的要求,定时地完成数据的抽取并加载到数据仓库系统中。由于ETL 的执行是在Oracle 10g 数据库中,可以充分利用Oracle 10g 数据库提供的强大并行处理能力,保证数据获取的高效、可靠执行。
数据存储层:Oracle 10g数据库实现对数据仓库系统各种类型数据的集中存储和管理,包括各种结构化数据 和非结构化数据。Oracle 10g数据库内置OLAP和数据挖掘功能,不需要进行复杂的数据迁移,就可以直接 在关系数据库中完成复杂的统计分析功能。Oracle 10g数据库通过使用分区技术可以支持海量数据的存储,一个数据库最大数据量为8,000 PB(1PB=1024TB)。Oracle 10g提供强大的并行处理能力,满足数据仓库系统 对于性能和扩展性方面的要求。而且系统通过网格控制台(Grid Control)进行数据仓库统一管理。
数据展现层:Oracle提供全新的商务智能解决方案Oracle BI EE、OLAP分析开发工具(JDeveloper+BI Beans)和 数据挖掘工具(Oracle Data Miner),将统计分析的结果通过各种方式展现。Oracle的数据展现方案使用Java 和 HTML两种方式实现,基于标准的J2EE平台。由于使用统一的元数据库,不需要进行元数据的交换,能够 最大限度地减少系统的维护工作。同时,Oracle的数据展现方案提供具有强大分析功能和非常易用的分析 仪表板, 并支持通过门户(Portal)技术进行集成,为不同类型的用户提供一致的访问界面。
相关阅读
数据仓库是一个面向主题的、集成的、不可更新的、随时间不断变化的数据集合,它用于支持企业或组织的决策分析处理。
数据仓库,英文名称为Data Warehouse,可简写为DW。
数据仓库之父Bill Inmon在1991年出版的“Building the Data Warehouse”一书中所提出的定义被广泛接受——数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。