BI入门
最近想学习BI,因为自己做的一个项目用到了大量Oracle分析函数,而烃使用使用OLAP技术,系统目前数据量少,速度相对来说可以。每天数据量这么大,谁能保证积累了两年的数据后,运算速度还有这么快呢。这让我不得不思考我在做的项目与BI的差别,BI这概念之前只听说过没深入了解更没有用过相应的工具。一开始自己就想到开源的BI工具,就开始下载,找入门文档。两天之后让我发现这行不通,连概念都不理解,仅有工具是不行的。我们需要理解它的定义、历史、作用,才能开始学习它,才需要用过工具。
1、BI的定议:
BI(BusinessIntelligence)是一种运用了数据仓库、在线分析和数据挖掘等技术来处理和分析数据的崭新技术,目的是为企业决策者提供决策支持。
从定义上我们要明白BI运行的基础是:数据仓库,和联机分析,数据挖掘
目的:提供决策支持
2、BI分类
信息类BI应用
指由原始数据加工而来的数据查询、报表图表、多维分析、数据可视化等应用,这些
应用的共同特点是:将数据转换为决策者可接受的信息,展现给决策者。例如将银行交易数据加工为银行财务报表。
知识类BI应用
指通过数据挖掘技术和工具,将数据中隐含的关系发掘出来,利用计算机直接将数据加工为知识,展现给决策者。
3、BI的应用模式
A、初级模式
数据查询和生成报表,这是BI的初级应用模式
B、
1、BI高级应用模式
OLAP,即联机分析处理,是BI带来的一种全新的数据观察方式,是BI的核心技术之一。
2、数据挖掘
数据挖掘的目的是通过计算机对大量数据进行分析,找出数据之间潜藏的规律和知识,并以可理解的方式展现给用户。数据挖掘是最高级的BI应用,因为它能代替部分人脑功能。
数据挖掘的三大要素是:
技术和算法:目前常用的数据挖掘技术包括——
自动类别侦测(AutoClusterDetection)
决策树(DecisionTrees)
神经网络(NeuralNetworks)
数据:由于数据挖掘是一个在已知中挖掘未知的过程,
因此需要大量数据的积累作为数据源,数据积累
量越大,数据挖掘工具就会有更多的参考点。
预测模型:也就是将需要进行数据挖掘的业务逻辑由
计算机模拟出来,这也是数据挖掘的主要任务。
4、底座——数据仓库技术
数据仓库(DataWarehouse)是一个面向主题的(SubjectOriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(TimeVariant)的数据集合,用于支持管理决策。以上是数据仓库的官方定义。
5、总结:
要想学好BI,以上知识点是基础。必须把基础学习才能深切的理解BI,理解客户在这主面真正意义上的需求。