大数据、机器学习及人工智能必读书目——《Python数据分析基础》
大数据、机器学习及人工智能必读书目——《Python数据分析基础》
我们已经进入了全新的数据时代,大数据、云计算、物联网、机器学习、人工智能等等一系列技术纷至沓来,数据的管理和应用已经渗透到每一个行业和业务领域,成为当今以及未来商业运作的基础资产。可以说,只有掌握数据并善于运用数据的人,才会在竞争日益激烈的环境中寻得先机。 那么我们该怎么样学习大数据分析、机器学习以及人工智能?作者认为,学习大数据、机器学习和人工智能,所需的知识分为五个层次,一是数学知识;二是统计学知识;三是算法知识;四是工具知识;五是哲学思想知识。所谓工具知识,就是我们需要借助计算机软件来完成相关的分析和运算,目前大数据和机器学习领域热门的语言就是 R 和 Python。我们会分别介绍这五个层次所需要看的书,希望对大家有用。
《Python数据分析基础》
作者:[美]Clinton W. Brownley
译者: 陈光欣
出版:人民邮电出版社 2017年版
简要评价:
可能有点不负责任哦,这本书我还没看过。偶尔看到牛逼的 pandas 库之父——Wes McKinney 大神推荐这本书,再翻了翻目录,觉得非常不错,就给大家推荐了。所以我现在无法给出评价,等书来了看过了再补上吧。
书籍自我的营销词是:零编程经验也可学会用Python语言进行数据分析,python基础知识介绍、csv文件和Excel文件读写、数据库操作等。
作者是 Clinton W. Brownley 博士,Facebook 数据科学家,负责大数据流水线、统计建模和数据可视化项目,并为大型基础设施建设提供数据驱动的决策建议。
名家推荐
“这本书对于那些使用数据的Python新手来说,是非常有用的学习资源。它的教学风格和附带的例子会帮助用户尽快熟悉Python语言、编程环境和Python生态系统中zui常用的几个软件包。”
——Wes McKinney,pandas库之父
内容介绍:
想深入应用手中的数据?还是想在上千份文件上重复同样的分析过程?
没有编程经验的非程序员们如何能在zui短的时间内学会用当今炙手可热的Python语言进行数据分析?
来自Facebook的数据专家Clinton Brownley可以帮您解决上述问题。在他的这本书里,读者将能掌握基本Python编程方法,学会编写出处理电子表格和数据库中的数据的脚本,并了解使用Python模块来解析文件、分组数据和生成统计量的方法。
书籍目录
前言
第 1 章 Python 基础
1.1 创建 Python 脚本
1.2 运行 Python 脚本
1.3 与命令行进行交互的几项技巧
1.4 Python 语言基础要素
1.5 读取文本文件
1.6 使用 glob 读取多个文本文件
1.7 写入文本文件
1.8 print 语句
1.9 本章练习
第 2 章 CSV文件
2.1 基础 Python 与 pandas
2.2 筛选特定的行
2.3 选取特定的列
2.4 选取连续的行
2.5 添加标题行
2.6 读取多个 CSV 文件
2.7 从多个文件中连接数据
2.8 计算每个文件中值的总和与均值
2.9 本章练习
第 3 章 Excel 文件
3.1 内省 Excel 工作簿
3.2 处理单个工作表
3.3 读取工作簿中的所有工作表
3.4 在 Excel 工作簿中读取一组工作表
3.5 处理多个工作簿
3.6 本章练习
第 4 章 数据库
4.1 Python 内置的 sqlite3 模块
4.2 MySQL 数据库
4.3 本章练习
第 5 章 应用程序
5.1 在一个大文件集合中查找一组项目
5.2 为 CSV 文件中数据的任意数目分类计算统计量
5.3 为文本文件中数据的任意数目分类计算统计量
5.4 本章练习
第 6 章 图与图表
6.1 matplotlib
6.2 pandas 183
6.3 ggplot 184
6.4 seaborn 1
第 7 章 描述性统计与建模
7.1 数据集
7.2 葡萄酒质量
7.3 客户流失 203
第 8 章 按计划自动运行脚本
8.1 任务计划程序(Windows 系统)
8.2 cron 工具(macOS 系统和 Unix 系统)
第 9 章 从这里启航
9.1 更多的标准库模块和内置函数 221
9.2 Python 包索引(PyPI):更多的扩展模块 222
9.3 更多的数据结构 232
9.4 从这里启航 234
附录A 下载指南
附录B 练习答案
作者介绍
封面介绍
喜欢闲适安静的生活,懂一点计算机编程,懂一点统计学和数据分析。(爱编程爱统计)