掌握数据科学和机器学习数学基础必备的7本书
想要精通数据科学,就必须对基础数学有很好的理解。考虑到这一点,我在这里推荐七本可以帮助到你的书。
大多数人学习数据科学,会把重点放在编程。然而,想要真正精通数据科学(和机器学习),就不能忽视数据科学背后的数学基础。在这篇文章中,我将介绍在学习数据科学数学基础方面过程中常用的七本书。用“享受”来描述这种感受似乎也不为过。
那么,你为什么要努力学习数据科学的数学基础呢?
以下是我的一些理由:
人工智能日新月异。GeoffreyHinton认为我们应该重新考虑反向传播。而理解数学会帮助我们更好地理解人工智能的进化。它将帮助我们区别于那些只从表面思考人工智能的人。它将帮助我们更好地看到知识产权的潜力。而且,理解数据科学背后的数学知识也可以帮助我们在人工智能和数据科学方面的取得丰厚的回报。
当然,我使用这些书也有其他目的。
1.首先,这些书已经成为我在牛津大学物联网课程的教学过程中的一部分,同时也包括了我在人工智能应用教学所要用的基本数学方法。
2.第二,我正在写一本书,它将从数学的角度为14到18岁的孩子进行简单的人工智能描述。在这本书中讲到,想要理解数据科学和人工智能的数学基础,你需要知道四件事。即线性代数、概率论、多元微积分和最优化。这些课程大部分(至少部分)是在高中教授的。因此,可以试图把高中数学与人工智能和数据科学联系起来,把重点放在数学建模上。
1. 统计学习理论的本质 作者:Vladimir Vapnik.
https://www.amazon.com/Nature-Statistical-Learning-Theory/dp/8132202597/ref=redir_mobile_desktop?_encoding=UTF8&dpID=11poThT9XmL&dpPl=1&keywords=vapnik&pi=AC_SX118_SY170_QL70&qid=1522414077&ref=plSrch&ref_=mp_s_a_1_1&sr=8-1
你如果想做一个关于数学书籍的清单,那么一定不能避开伟大的俄罗斯数学家!因此,我的第一本推荐书目是弗拉基米尔·瓦普尼克的“统计学习理论的本质”。在我推荐的所有书目中,瓦普尼克是最难找到的。我有一个较旧的印度版。弗拉基米尔·瓦普尼克(Vladimir Vapnik)是支持向量机(SVM)的创始人。你可以在他的维基百科网页查看更多关于他的内容。
2. 模式分类(2007-12-24) 作者:理查德·奥杜达(Richard O Duda)
https://www.amazon.co.uk/dp/B01N9M71LT/ref=cm_sw_r_em_apa_WdJVAb3037FVR
和Vapnik博士的书一样,Duda也是另一个时代的经典。第一次出版于1973。25年后(即2000年)又进行了一次更新。这本书是重要的文献材料。它采取模式识别的方法,提供了广泛的算法覆盖。
3. 机器学习:算法视角,第二版(Chapman&Hall/CRC机器学习和模式识别) 作者:斯蒂芬·马斯兰(Stephen Marsland)
https://www.amazon.co.uk/Machine-Learning-Algorithmic-Perspective-Recognition/dp/1466583282/ref=sr_1_1?ie=UTF8&qid=1522398255&sr=8-1&keywords=marsland+machine+learning&dpID=51JVZWc%252BctL&preST=_SY291_BO1,204,203,200_QL40_&dpSrc=srch
斯蒂芬·马斯兰的书现在已经出版了第二版。马斯兰是我读过的最早的书之一(我现在只有第一版)。新旧两版都很好。我认为第二版在Python中有很多编码。和前两本书一样,这本书也非常强调算法。
4. 统计学习的要素:数据挖掘,推理和预测(第二版)作者:Trevor Hastie,Robert Tibshiani,Jerome Friedman
https://www.amazon.co.uk/dp/0387848576/ref=cm_sw_r_em_apa_o-aWAbXMMFM4Z
哈斯蒂是另一个经典。我的这本书是彩色的。这是我所说的另一本参考书。
5. 模式识别与机器学习(信息科学与统计) 作者:克里斯托弗·M·毕晓普
https://www.amazon.co.uk/Pattern-Recognition-Learning-Information-Statistics/dp/0387310738/ref=sr_1_1?ie=UTF8&qid=1522510002&sr=8-1&keywords=bishop&dpID=61FKyOeM7KL&preST=_SY344_BO1,204,203,200_QL70_&dpSrc=srch
模式识别和机器学习(信息科学和统计)(克里斯托弗M.毕晓普)也是一本极具深度的参考书。
6. 机器学习:关于数据意义的算法的艺术和科学 作者:彼得·弗拉赫
https://www.amazon.co.uk/Machine-Learning-Science-Algorithms-Sense/dp/1107422221/ref=sr_1_1?ie=UTF8&qid=1522570580&sr=8-1&keywords=machine+learning+peter+flach
即便一些亚马逊评论称它冗长,并指出缺乏代码,我也依旧喜欢PeterFlach的书。我特别喜欢Flach算法的分组(逻辑模型、线性模型、概率模型)和主题的总体处理。
最后是我力荐的书:
7. 深度学习 作者,古德费罗、本吉奥和科维尔
https://www.amazon.co.uk/Deep-Learning-Adaptive-Computation-Machine/dp/0262035618/ref=sr_1_1?ie=UTF8&qid=1523226978&sr=8-1&keywords=bengio+deep+learning
如果有本书,你非读不可。那一定是它了。详细又极具现代视野,涵盖了你所能想到的一切。
(下面是两个有价值的补充)
机器学习第一课,第二版(机器学习与模式识别),作者是西蒙·罗杰斯,马克·吉罗拉米。这是我率先得到的一本书(第一版)。我不推荐初学者看它,但它的确是一本很好的书(尤指第二版)。
机器学习:从凯文·墨菲的概率视角。这本书评价很高--但我没有亲自看过(因此不在名单上)。
如果你有其他更好的推荐,请告诉我。
总结:
除了古德费尔德-本吉奥的书外,我不建议你都认认真真的仔细看完。我喜欢阅读有主题的这些书,把它们当做参考书。我还喜欢来自不同作者的例子,如用鱼类做分类的前杜达;哈斯蒂用广告数据来卖电视和收音机;弗拉赫假设空间概念和海洋动物的例子等。
我发现这些书教会了我一个道理,就是保持谦卑。你所知道的永远是这广阔世界的一小部分。
经典书目永不朽。弗拉基米尔·瓦普尼克(Vladimir Vapnik)今年81岁。杜达的书于1973首次出版。我预计即便50年后,这些书也不会过时。就像那些经得起时间考验的老朋友。这是个令人欣慰的想法。它显示了基础数学的寿命。