R及Python的数据分析入阶—小白必看(文末附学习资料分享)
前情提要:博主在数据分析中一直用R比较多,近期开始转向Python。作为Python初阶,从贯用R进行数据分析及建模的使用视角,简单谈谈对它的看法。
后期有时间会写一篇关于R及Python的优势比较,刚刚开始接触数据分析的小伙伴不用太纠结于到底哪个语言好,应该学哪个,外界或者企业当中对两者的使用及评价也鳞次栉比。我的建议是,有兴趣有时间两个都上!你会体会到R在数据分析中的强大直接和Python的高效优美!
众所周知,Python作为一门免费、自由的编程语言,在软件开发,游戏开发,Web开发,数据分析及数据挖掘领域有着非常广泛的运用。
当然啦,博主作为一枚数据er,更关注Python在数据分析及数据挖掘方面的表现。
插播一条小tip:
对于一项我们还不太熟悉的编程语言或者实现工具,我们总是可以先用3W2H对其有个初步的框架认知。这一简单高效的认知方法可以应用到我们工作生活的方方面面,也是在处理分析问题时需要具备的良好素养。不信,大家可以把目前手头的事情或者想要了解的事物从3W2H的5个维度来画一画,只需十几分钟的时间,是不是瞬间思路清晰多了。在我们处理来自外界、网络的繁杂信息时,帮助大脑高效的快速的抓取有效信息并捋顺思路。
① what 什么是Python
一门免费、自由的编程语言
常用于软件、游戏、以及web开发。当然也可以应用于数据分析、数据挖掘,数据可视化等,是一款强大的数据分析、数据挖掘工具。
② who 谁在使用Python
Python有着非常丰富的统计分析包,常用的统计分析场景有统计分布、假设二检验、统计建模等。
同样Python令我们青睐的还有强大的数据挖掘包,可以进行挖掘算法设计、数据建模、机器学习等。
Python的使用场景远远不仅在以上应用中出现,随着BigData的发展,Python会在数据领域发挥更大的作用。
③ why 为什么选择Python
首先,Python是一种解释型、动态语言,具有明确而高效的语法。
其次,Python不断地从其他优秀的数学软件引入高效的数据开发包。这一点也是当初博主青睐R的原因,一个开源的,不断更新packages,有活力的数据社区谁能抗拒呢。
常用的数据开发包:
数据处理:pandas
数据挖掘:sklearn
数据可视化:matplotlib
Python被称为可执行的伪代码,有着优美的代码风格。可以简单的实现书上或者论文中的算法,简单高效,这也是我喜欢它的原因。
④ how 及 how continue
Python作为一门工具性质的编程语言,和c、Java等编程语言一样,我们对结构了解以后,just have a try!使用Python去处理、分析我们实际工作中的数据,理解分析方法背后的算法思想以及计算方法,这才是持续高效性学习Python的精髓所在。
博主是一个喜欢记录的人,这一习惯的养成跟工作性质有关。关于博客中的R及Python学习板块,我会把我在学习使用R及Python的过程中,最常用最简单的方法整理出来。所谓80/20,其实我们可以通过20%最常用,最简洁的方法解决工作中的大部分问题。