新年荐书!数据科学领域初学、进阶必读6本书
2018年最后的夜晚刚刚过去,元旦假期不知你的身体和你的心灵哪一个会在路上呢?小编特意为广大读者甄选了6本数据科学领域必读书籍,旅行的同时也可以充充电,无论你是初识大数据的小白还是想开阔视野的从业者都有适合你的那一本书。
1. 《数据资本时代》
作者:维克托·迈尔-舍恩伯格
推荐语:畅销书《大数据时代》作者舍恩伯格在新书《数据资本时代》中,展示了大数据将如何从根本上改变经济——这并不是因为数据是一种新型石油,而是因为数据是一种新型润滑脂,它将给市场带来巨大能量,给公司带来巨大压力,使金融资本的作用大大削弱。赢家是市场,而并非资本。作者阐述了数据时代的未来正呈现出的一些新的趋势:数据为市场的多样化深度发展提供了更多可能;数据推动公司寻求新的模式;化解数据时代带给人类的隐忧。作者在这本书中提出了很多令人耳目一新的概念,比如,“用数据交税”“数字投资顾问”“资本功能的分离”“单人公司” 等。这些新概念会令公司的管理者、创业者脑洞大开。
2. 《数据挖掘导论(完整版)》
作者:Jure Leskovec,Anand Rajaraman,Jeffrey David Ullman
推荐语:本书全面介绍了数据挖掘的理论和方法,旨在为读者提供将数据挖掘应用于实际问题所必需的知识。本书涵盖五个主题:数据、分类、关联分析、聚类和异常检测。除异常检测外,每个主题都包含两章:前面一章讲述基本概念、代表性算法和评估技术,后面一章较深入地讨论高级概念和算法。目的是使读者在透彻地理解数据挖掘基础的同时,还能了解更多重要的高级主题。此外,书中还提供了大量示例、图表和习题。
3. 《命令行中的数据科学》
作者:Jeroen Janssens
推荐语:本书讲解众多实用的命令行工具。无论使用Windows、OS X,还是Linux,都可以安装包含80多个命令行工具的“数据科学工具箱”,你将学会如何结合使用这些小而强大的命令行工具,快速地获取、清洗、探索和建模数据。
4. 《腾云:云计算和大数据时代网络技术揭秘(国内第一本云计算网络书)》
作者:徐立冰
推荐语:本书是国内第一本系统讲解云计算网络的书籍。通过阅读本书,读者将清楚地了解到如何在云计算与大数据时代构建安全、可靠、高速与灵活的网络。本书语言通俗易懂,内容深入浅出,可作为云计算网络技术入门和提高阶段的自学、参考书籍。适合国内云计算网络、新一代网络建设、网络管理、系统集成行业的开发人员、技术工程师、售前与售后技术支持人员学习。
5. 《图解机器学习》
作者:杉山将
推荐语:本书用丰富的图示,从最小二乘法出发,对基于最小二乘法实现的各种机器学习算法进行了详细的介绍。第Ⅰ部分介绍了机器学习领域的概况;第Ⅱ部分和第Ⅲ部分分别介绍了各种有监督的回归算法和分类算法;第Ⅳ部分介绍了各种无监督学习算法;第Ⅴ部分介绍了机器学习领域中的新兴算法。书中大部分算法都有相应的MATLAB程序源代码,可以用来进行简单的测试。
6. 《大数据:互联网大规模数据挖掘与分布式处理(第2版)》
作者:Jure Leskovec,Anand Rajaraman,Jeffrey David Ullman
推荐语:本书源自作者在斯坦福大学教授的“海量数据挖掘”(CS246: Mining Massive Datasets)课程,该版本新增影响与同质性、社交媒体推荐和行为分析等超实用内容,涵盖解决数据挖掘核心问题所用算法,及实际应用数据挖掘所需知识,理论与实现并重。
— 完 —
关注清华-青岛数据科学研究院官方微信公众平台“THU数据派”及姊妹号“数据派THU”获取更多讲座福利及优质内容。