大数据挖掘视频教程入门到精通
《玩转大数据:深入浅出大数据挖掘技术(Apriori算法、Tanagra工具、决策树)》
课程讲师:艾伦
课程分类:.net
涉及项目:数据挖掘软件开发
用到技术:C#、SQLServer
其他特性:数据分析、分类器、关联分析、聚类算法
涵盖内容:代码、视频、PPT
课时数量:10
本课程名为深入浅出数据挖掘技术。所谓“深入”,指得是从数据挖掘的原理与经典算法入手。其一是要了解算法,知道什么场景应当应用什么样的方法;其二是学习算法的经典思想,可以将它应用到其他的实际项目之中;其三是理解算法,让数据挖掘的算法能够应用到您的项目开发之中去。所谓“浅出”,指得是将数据挖掘算法的应用落实到实际的应用中。课程会通过三个不同的方面来讲解算法的应用:一是微软公司的SQLServer与Excel等工具实现的数据挖掘;二是著名开源算法的数据挖掘,如Weka、KNIMA、Tanagra等开源工具;三是利用C#语言做演示来完成数据挖掘算法的实现。
根据实际的引用场景,数据挖掘技术通常分为分类器、关联分析、聚类算法等三大类别。本课程主要介绍这三大算法的经典思想以及部分著名的实现形式,并结合一些商业分析工具、开源工具或编程等方式来讲解具体的应用方法。
课程大纲
1)数据挖掘概述与数据
本章讲解了数据挖掘技术的起源、应用场景以及基本的处理方法,并对于数据集、数据等基本的概念做了阐释。
2)可视化与多维数据分析(实践课)
本章讲解了数据可视化的基本方法,并分别演示了Excel数据透视表与SQLServerAnalysisService对于多维数据的可视化处理。(OLAP)
3)分类器与决策树
本章讲解了分类器的基本概念与应用方法,并具体分析了分类器经典算法之一决策树的实现方法。
4)其他分类器(上)
本章讲解了另外两种经典的分类器算法:基于规则的分类器与基于距离的分类器。
5)其他分类器(下)
本章讲解了其他一些常见的分类器算法,如基于距离的分类器的改良算法、贝叶斯分类器、人工神经网络、支持向量机与组合方法等。
6)决策树的应用(实践课)
本章演示了利用WekaExplorer、KNIME、Tanagra等开源工具进行的数据挖掘处理。演示中对比了几类数据挖掘算法,如Cart决策树、C4.5决策树、KNIME决策树、简单贝叶斯分类、组合方法(装袋)、人工神经网络、基于规则的分类等。
7)关联分析
本章讲解了关联分析的常见算法,即Apriori算法与FP增长算法。
购物车数据分析(实践课)
本章主要演示了利用微软的解决方案来进行购物车数据的关联分析,包括SQLServiceAnalysisService的关联分析与Excel结合SSAS外接程序等方法。最后还利用WekaKnowledgeFlow工具来进行关联分析,以便对比第六章的实践。
9)聚类算法
本章讲解了聚类算法的基本原理与常见算法,包含K均值算法、层次聚类、基于密度的聚类算法。
10)聚类算法C#源代码实现(实践课)
本章演示如何通过C#源代码实现聚类算法。
全套教程下载地址:
360:http://yunpan.cn/Q9sNne2gMZVe4(提取码:7a26)
百度:http://pan.baidu.com/s/1cgemr