学Python就能做好数据分析?万能语言背后是一片韭菜地
“会python的大学生,找工作有多赚?“
“python到底是什么鬼,学姐靠他拿了5个offer"
“数据分析还在用Excel?学会python效率高10倍!“
......
这样的标题你在朋友圈、公众号一定见过,不管是技术类公众号,还是求职公众号,甚至情感鸡汤类公众号都会时不时地给你推一篇让你学python的文章,尤其在数据分析领域,“python数据分析“的公众号或者文章遍地都是,当然,你随手点开一个类似上述标题的文章,拉到最后一定都是一个python课程的报名广告...
在铺天盖地广告的洗脑下,让很多想要学习数据分析或者已经从事数据分析的人产生了这样的疑问:python真的很厉害吗?学数据分析一定要python吗?它为什么可以这么火?
首先,不可否认,python的确是一门非常好的编程语言,应用非常广泛,语法简洁、代数逻辑清晰,而且拥有海量的第三方库。
在数据分析领域功能十分强大, 数据爬取、清洗、可视化分析,挖掘....python无所不能。开发效率高、运营速度快、而且入门简单,据说,部分地区的小学生信息课程甚至也加入了Python,看起来学 python是大势所趋,势不可挡。
但是数据分析的都要学python吗?
答案显然不是。
不管是python、R还是Excel、spss,这些都是数据分析的工具,对于数据分析,我一直强调核心是业务,通过业务的分析逻辑影射到数据分析的处理逻辑,而数据分析工具则是帮助我们实现结果的手段。
如果把数据分析的结果比喻成你要去的一个目的地,那么python只是可以到达这个目的地的一个交通工具,换句话来说,你换个工具也能做到,所以python和数据分析之间,并没有不可分割的关系。
既然关乎到选工具,肯定是选择最好用工具才能够最快达到目的,那python是不是数据分析工具的最佳选择呢?
不一定是。不一样的路适合的交通工具不一样,同样,不一样的类型的数据分析工作,合适的数据分析工具也不一样。
在实际工作中,数据分析这个大类的岗位层次不一,岗位职能也大不相同,在不同的公司,同样都叫数据分析师的岗位,可能一个就是给业务取数,提供基础数据支撑,而另一个却要涉及数据建模、挖掘。这两种人需要掌握的工具技能肯定也大不相同。
我这里把数据分析笼统的分类业务向和技术向两类:
业务类分析师,侧重业务分析,一般挂靠在业务部门,或者有单独数据分析部门,最要工作内容就是对特定业务做专题分析,通过对数据分析来做一些业务规划、方案等。日常的工作大多就是整理报表,做一些探索性的业务分析,解决业务问题。
技术类分析师,一般都在IT部、数据中心。根据从事的工作环节不同,被分成数据库工程师,ETL工程师,爬虫工程师,算法工程师等角色,主要的工作一般有数据仓库搭建、专题分析、建模分析、数据挖掘预测等。
说完数据分析师的工作内容,再来看目前市场流行的几类数据分析工具:Excel、python/R、BI工具
先说大家都熟悉的Excel,excel在数据分析领域的地位不可动摇,尤其对入门新手来说,大部分的人在进入工作之前都多少接触Excel,所以在此基础上要做数据分析,学习Excel是最合适不过的,从简单的表格制作,数据透视表,写公式,再到VBA语言,基本能够满足80%业务人员的分析需求。而且学习Excel的成本比学习一门编程语言低多了。
(见过有很多机构开始利用职场焦虑忽悠普通职场人学python,说句良心话,花费大几千甚至破万的价格去报班学python,没有基础几个月也只能学个皮毛,回到自己的工作中根本用不上,除非你认真考虑转行,当然转行也不可能像培训机构说的那么简单)
回到正题,我们再说BI工具,BI的诞生,目的是为了缩短从业务数据到经营决策的时间,提高决策效率,所以它的产品设计理念就是围绕提高数据分析的过程展开的。
和Excel相比,BI工具在分析流程上更加简化,以我用过的FineBI为例,从数据链接、数据处理、到可视化图表分析,很多功能都是封装好的,鼠标点击拖拽就能迅速完成一次分析。这样的可视化操作界面让BI的学习门槛大大降低,更适合面向企业中的业务分析人员。
另外,在面对大数据量分析时,BI工具也能弥补Excel的不足,还有一个吸引人的点,就是BI工具的可视化效果,在Excel中制作动态图表或者高级的可视化图表效果,需要经过诸多复杂的步骤,用编程语言实现,也需要一行行代码调整,才能得到想要的效果,但是在BI工具中,简单拖拽设置,就能制作出令人惊艳的可视化图表
不过,因为BI工具是非开源的,所以在功能上有局限性,如果产品没有设计某一项功能,可能就没有办法完成分析工作。这时候python或R这类编程语言就显得更加灵活了,只要代码写得好,基本没有实现不了的东西。
而且在数据挖掘、机器学习领域,BI和Excel就更加无能为力了,在这个阶段,python语言是一个绝佳选择,它对复杂的数据处理、建模、预测更加游刃有余。
最后总结一下,工具的选择要根据自身需要,而不是哪个火学哪个,只有最适合自己的才是最好的。
像财务、人事、运营这类的基础业务分析,excel完全就够用了,如果想要提升效率,追求可视化效果,BI工具也是不错的选择,完全没有必要花费极大的精力去凑Python的热闹,当然如果你对编程很感兴趣,那当我没说。
最后再来回答最后一个问题,为啥python这么火?
当然是因为好赚钱,以前互联网兴起的时候,各种java、C++的培训炒的火热,培训机构大把大把捞金,现在大数据时代来了,数据分析、数据挖掘、人工智能的概念又火了,一片新的韭菜地出现在眼前,培训机构们还能放着这么多的钱不赚?
随便拿个业内TOP数据分析师的薪资给你画个月入2W的大饼,实际上你入职大概率6-8K,而且你在培训课里学到那点皮毛功夫还要面临全网被割韭菜的各行各业神仙转行来和你PK,最后能找到心仪工作的少之又少。