大数据、机器学习必读书目——《Python数据分析与挖掘实战》

大数据、机器学习及人工智能必读书目——《Python数据分析与挖掘实战》

我们已经进入了全新的数据时代,大数据、云计算、物联网、机器学习、人工智能等等一系列技术纷至沓来,数据的管理和应用已经渗透到每一个行业和业务领域,成为当今以及未来商业运作的基础资产。可以说,只有掌握数据并善于运用数据的人,才会在竞争日益激烈的环境中寻得先机。 那么我们该怎么样学习大数据分析、机器学习以及人工智能?作者认为,学习大数据、机器学习和人工智能,所需的知识分为五个层次,一是数学知识;二是统计学知识;三是算法知识;四是工具知识;五是哲学思想知识。所谓工具知识,就是我们需要借助计算机软件来完成相关的分析和运算,目前大数据和机器学习领域热门的语言就是 R 和 Python。我们会分别介绍这五个层次所需要看的书,希望对大家有用。

《Python数据分析与挖掘实战》

  • 作者:张良均 / 王路 / 谭立云 / 苏剑林

  • 页数: 335

  • 出版:机械工业出版社 2016年版

大数据、机器学习必读书目——《Python数据分析与挖掘实战》

简要评价:

这本书真的是一本实践入门书,由十多位资深大数据专家结合10余年数据挖掘与实施经验,通过10余个真实的案例为10余个行业的数据挖掘给出了解决方案。因此我个人的感觉是适合有一定基础的人看,否则看过之后好像明白了,但是自己用的时候又不知道咋办了,不管怎么样,一定的数学、统计学基础是学好大数据分析的前提和基础、

从实践的角度来说,这本书非常不错,案例选的很好,都是实际应用的项目,不是作者为了写书而编造出来的,很适合有一点理论基础,推荐给有一定理论基础,想迅速开展大数据分析实战的同学们读。

内容介绍:

10余位数据挖掘领域资深专家和科研人员,10余年大数据挖掘咨询与实施经验结晶。从数据挖掘的应用出发,以电力、航空、医疗、互联网、生产制造以及公共服务等行业真实案例为主线,深入浅出介绍Python数据挖掘建模过程,实践性极强。

本书共15章,分两个部分:基础篇、实战篇。基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得数据挖掘项目经验,同时快速领悟看似难懂的数据挖掘理论。读者在阅读过程中,应充分利用随书配套的案例建模数据,借助相关的数据挖掘建模工具,通过上机实验,以快速理解相关知识与理论。

基础篇(第1~5章),第1章的主要内容是数据挖掘概述;第2章对本书所用到的数据挖掘建模工具Python语言进行了简明扼要的说明;第3章、第4章、第5章对数据挖掘的建模过程,包括数据探索、数据预处理及挖掘建模的常用算法与原理进行了介绍。

实战篇(第6~15章),重点对数据挖掘技术在电力、航空、医疗、互联网、生产制造以及公共服务等行业的应用进行了分析。在案例结构组织上,本书是按照先介绍案例背景与挖掘目标,再阐述分析方法与过程,最后完成模型构建的顺序进行的,在建模过程的关键环节,穿插程序实现代码。最后通过上机实践,加深读者对数据挖掘技术在案例应用中的理解。

书籍目录

前言

基础篇

第1章 数据挖掘基础

  • 1.1 某知名连锁餐饮企业的困惑

  • 1.2 从餐饮服务到数据挖掘

  • 1.3 数据挖掘的基本任务

  • 1.4 数据挖掘建模过程

  • 1.5 常用的数据挖掘建模工具

  • 1.6 小结

第2章 Python数据分析简介

  • 2.1 搭建Python开发平台

  • 2.2 Python使用入门

  • 2.3 Python数据分析工具

  • 2.4 配套资源使用设置

  • 2.5 小结

第3章 数据探索

  • 3.1 数据质量分析

  • 3.2 数据特征分析

  • 3.3 Python主要数据探索函数

  • 3.4 小结

第4章 数据预处理

  • 4.1 数据清洗

  • 4.2 数据集成

  • 4.3 数据变换

  • 4.4 数据规约

  • 4.5 Python主要数据预处理函数

  • 4.6 小结

第5章 挖掘建模

5.1 分类与预测 5.2 聚类分析 5.3 关联规则 5.4 时序模式 5.5 离群点检测 5.6 小结

实战篇

第6章 电力窃漏电用户自动识别

  • 6.1 背景与挖掘目标

  • 6.2 分析方法与过程

  • 6.3 上机实验

  • 6.4 拓展思考

  • 6.5 小结

第7章 航空公司客户价值分析

  • 7.1 背景与挖掘目标

  • 7.2 分析方法与过程

  • 7.3 上机实验

  • 7.4 拓展思考

  • 7.5 小结

第8章 中医证型关联规则挖掘

  • 8.1 背景与挖掘目标

  • 8.2 分析方法与过程

  • 8.3 上机实验

  • 8.4 拓展思考

  • 8.5 小结

第9章 基于水色图像的水质评价

  • 9.1 背景与挖掘目标

  • 9.2 分析方法与过程

  • 9.3 上机实验

  • 9.4 拓展思考

  • 9.5 小结

第10章 家用电器用户行为分析与事件识别

  • 10.1 背景与挖掘目标

  • 10.2 分析方法与过程

  • 10.3 上机实验220

  • 10.4 拓展思考221

  • 10.5 小结222

第11章 应用系统负载分析与磁盘容量预测

  • 11.1 背景与挖掘目标

  • 11.2 分析方法与过程

  • 11.3 上机实验

  • 11.4 拓展思考

  • 11.5 小结

第12章 电子商务网站用户行为分析及服务推荐

  • 12.1 背景与挖掘目标

  • 12.2 分析方法与过程

  • 12.3 上机实验

  • 12.4 拓展思考

  • 12.5 小结

第13章 财政收入影响因素分析及预测模型

  • 13.1 背景与挖掘目标

  • 13.2 分析方法与过程

  • 13.3 上机实验

  • 13.4 拓展思考

  • 13.5 小结

第14章 基于基站定位数据的商圈分析

  • 14.1 背景与挖掘目标

  • 14.2 分析方法与过程

  • 14.3 上机实验

  • 14.4 拓展思考

  • 14.5 小结

第15章 电商产品评论数据情感分析

  • 15.1 背景与挖掘目标

  • 15.2 分析方法与过程

  • 15.3 上机实验

  • 15.4 拓展思考

  • 15.5 小结 参考文献


喜欢闲适安静的生活,懂一点计算机编程,懂一点统计学和数据分析。(爱编程爱统计)

相关推荐