决战大数据摘录
第一部分 从数据化运营到运营数据
1、大数据,为什么很多人只会谈,不会做
(1)大数据的经典定义4V:海量的数据规模(Volume)、快速的数据流转和动态的数据体系(Velocity)、
多样的数据类型(Variety)和巨大的数据价值(Value)。
(2) 断层是大数据所面临的严重问题,收集数据的人不知道将来的人怎么使用数据,创建模型的人也不
知道自己所采用的数据在未来是否稳定,使用模型的人也不知道整个数据的来路或加工过程。
2、大数据的本质是还原用户的真实需求
(1)识别,让似是而非的行为数据串联起来,企业有多大的能力去识别一个“碎片化了的个人”,是否
知道用户是谁,决定了企业数据收集行为的意义大小。
(2)数据收集的价值包含两个维度。一是企业价值,衡量这个数据对企业产生的价值,实现的是企业资
源的合理分配。二是客户价值,衡量这个数据对顾客的价值,如何帮助企业为客户提供更好的服务,
实现的是顾客体验的提升。
(3)如何更好地识别各个设备的使用者是否为同一个人,如何更好地理解用户在各个不同场景下表现出
来的不同需求,如何更好地理解数据融合后产生的价值,将是未来商业中每一个企业都必须考虑的问题。
3、“活”的数据才是大数据
(1)“死”数据就是单纯存储在数据库中,无法进行分析和使用,并且不能够产生价值的数据。
(2) “活”做数据收集,就是企业不要局限于只收集自己用户产生的数据,还要把“别人”的数据收集
过来进行综合分析。
(3)“活”看数据指标,就是指企业不要局限于已有的数据框架,而应该结合用户需求的不同场景来
灵活应用收集到的“活”数据。
4、无线数据,大数据的颠覆者
(1)保证PC和无线两份数的完整,通过用户体系将两份数据关联起来,就可以在分析的时候用彼此的
融合来还原用户的行为。
(2)面对无线数据, 要解决的两个问题:一是做到高效准确的收集,二是培养数据分析师的多屏思维。
5、数据分类与数据价值,什么才是你的核心数据
(1)数据分类的4大维度:按照是否可以再生的标准来看,可以分为不可再生数据和可再生数据。按照
数据所处的存储层次来看,可以分为基础层、中间层和应用层。按照数据业务归属来看,可以分为各个
数据主体。按照是否为隐私来区分,可以分为隐私数据和非隐私数据。
(2)数据的5大价值:一、识别与串联价值,在信息多元化的时代,单纯运用cookie来识别用户行为的
方式已经过时,能够辨别关系和身份的数据是最重要的,应该是有多少存多少,永远不要放弃。
二、描述价值,可以用来刻画研究对象,描述数据不是越多越好,而是应该收集和业务紧密相关的数据,
在复杂的数据中抽象出核心的点,分析数据的框架。三、时间价值,除了体现历史的数据之外,还有一个
价值是“即时”,对用户的现实场景进行即时数据推送。四、预测价值,能够对公司整体的经营策略及
未来的预判产生非常大的影响。五、产出数据的价值,很多数据本身并没有特别的含义,但是在几个数据
组合在一起或者对部分数据进行整合之后就产生了新的价值,比如商品的评价数据。
6、从用数据到养数据
(1)大数据背景下,必须考虑数据之间的关联性。一个单独的数据是没有意义的,要把数据放在一个
“数据框架”(场景)之中,才能看出存在的问题。
(2)养数据通常有两类,一类是网站自身没有的数据,需要用户主动提供的;另一类是公司拥有的,
但没有进行收集的数据。
(3)“用数据”更多的是一种方法论,而“养数据”则是一种数据战略,是基于深入业务理解的更高
层次的商业决策。
(4)我们做的很多决策都是yes或No,在面对或选择的时候,我们更容易被惯性牵绊,很多时候,我们
需要远离“或”的概念,要打破局限,不要把自己封闭在狭隘的思想中,才不会被困住而浑然不觉。
7、数据的盲点,负面数据的力量
(1)在数据中,盲点可以分为二类:一类是物理盲点,指在数据库中不存在这样的数据,即企业没有收集
到应该收集的数据,另一类是逻辑盲点,指有数据但是没有被很好的挖掘出来,很多时候与数据分析师
或者数据使用者的经验和敏感度有关系。
(2)面对数据盲点,正能量思考告诉你怎么做可以达到成功的终点,负能量思考则告诉你怎么做才不会
失败。当失败的代价越大、风险越高时,高风险能让一个人对不可预测性非常敏感,那时候的负能量思考
和避风险能力就自然而然地出现了。
(3)是否看到数据盲点价值的核心是,有没有看到应该看到的数据,有没有错失不应该错失的数据。
第二部分 阿里巴巴的大数据秘密
8、阿里巴巴的大数据实践
(1)“先开枪,后瞄准”,对于创业公司来说,管理者不需要把眼光放得过于长远。如果从短期目标出
发,在不断的观察之中发现问题,并且解决问题,很可能会更容易获得成功。
9、混、通、晒,阿里巴巴数据化运营的内三板斧
(1)混,混出数据,只有具备商业敏感的数据分析师,才会懂得使用什么数据来驱动公司实现经营
目标。数据部的人要和业务部的人经常“混”在一起。
(2)通,打“通”“混”的数据,知道带着业务问题来看数据或者带着数据来看业务,把数据打通,
一是商业理解和数据之间的“通”,另一种就是部门数据和部门数据的交叉。
(3)晒,是一种在“混”和“通”的基础上产生出来的最终的数据表现,是基于人、商业和数据结合
后的一种看数据和用数据的方法论。通过业务和数据的结合,将数据“晒”出来,创造出新的商业价值。
(4)思考,要学会关窗口,“关窗口”在计算机世界中很容易执行,关掉多余的窗口可大大减轻电脑的
运行负担。现实工作中,也不要将有限的思考资源浪费在不能产生价值的思考上面,将更多的时间留下来
做更有价值的决策。
10、存、管、用、阿里巴巴运营数据的外三板斧
(1)存,数据收集的开始,收集数据不是目的,让收集起来的数据如何产生价值才是最终的目的。
(2)管,保护好存储数据,学会用数据产品来解决获取及使用数据的问题。
(3)用,从收集数据到管理数据,在“用”数据的问题上,数据的分裂和重组,都能做到颠覆性创新。
第一步,建立用户的标签。1、通过业务规则结合数据分析来建立标签。2、通过模型来建立标签。
3、通过模型的组合来生成新的标签。
第二步,标签的应用。最核心的就是数据中间层和前台业务层的对接,让数据从成本转化成利润,
才能真正发挥出大数据的价值。
(4)用化骨绵掌解决本质问题,一方面,要找到本质问题,就需要我们在思考时排除过多的东西,
使我们能够更好地集中精力去解决重要的问题;另一方面,我们要有方法去发现本质问题,不断地用
逻辑方法将问题进行分解,直到不能分解为止,然后从根本处去解决这个问题。
11、大数据,未来商业的利器
(1)大数据价值的体现,在于数据与数据的连接。重要的是数据和数据之间的关系,而不是数据本身。
(2)数据的标签化管理,是一个非常重要的趋势。数据的属性标签是人类经验判断的数据,是数据后的数据。
(3)未来是人机的结合体,人和机器的结合,或者人和数据的结合将是未来的一种进步模式,人类将通过
数据变得更加智能。未来人类身上流动着的是血液以及数据。我们要学会人机分工,让人做人最擅长的
事情,让机器做机器最擅长的事情。
12、其它
(1)成功路上,有4种东西是可以积累的,分别是财富、人际关系、知识以及思维方式。在大数据时代,
信息泛滥,很多人完全没有关注过如何积累、分类及使用当前越来越容易获得的大数据,更别说让大数据
变得能为个人所用。
(2)做好个人大数据管理,关注某一领域,对某一种知识进行积累,须对所在行业中呈现出的信息进行
积累,要完成这个大数据积累的闭环,要求放进去的数据,一定要能够非常快速、实时地调用出来。
(3)在“养数据”的过程中,关键词标签是进行数据管理最重要的工具,透过标签我们可以快速定义一篇
报告的内容,。
(4)眼睛与大脑是互相影响的,你看到的将影响你的思考,反过来你的思考方式又影响着你看到的东西。
如果你不断地积累知识,你也会发现你的思考结构发生了改变,不仅仅是知识量上的改变,而且是思维方式
的颠覆式改变。
(5)“以无法为有法,以无限为有限”是李小龙创立格斗术“截拳道”的纲领和要义,他认为这种方法
不特别固定的格斗术的精髓就在于在动态中制胜。像李小龙的格斗一样去思考问题,不断的去问问题,
知道问题到底出在哪里,以找出每一个问题背后不一样的原因。例如被问到按钮是放在左边好还是右边
好时,我们就要了解放左边和放右边的区别是什么,如果得到的答案不足以让我们获得足够的信息时,
那我们就会针对答案不断地提出新问题。这就是思考问题时常会用到的方法论,称为“迂回”,
不是直奔一个目标,而是通过不断地寻找落地点慢慢行进。
(6)寻找爆发点,未来的数据角色对企业而言就像决斗一样,如果两个人的水平差不多,多“算”的人就
胜利了,而数据就是“算”的核心。“打蛇打七寸”,抓住主干,然后通过主干解决一系列的问题,
称为“爆发”。
(7)数据扮演的三种角色,第一阶段有多少数据收集多少数据。第二阶段,数据精准化,数据之间建立
关系,从点到线到面。第三阶段,建立数据模型,分析外围数据,为公司的下一步战略找到出路。