对话 CTO〡听神策数据 CTO 曹犟描绘数据分析行业的无限可能

​​专栏介绍

「对话 CTO」是极客公园的一档最新专栏,以技术人的视角聊聊研发管理者的发展和成长。

本专栏由ONES 的创始人&CEO 王颖奇作为特邀访谈者。王颖奇曾参与金山软件 WPS、金山毒霸等大型软件的核心开发工作;2011 年创立了正点科技,旗下产品正点闹钟、正点日历在全球用户过亿;2014 年,王颖奇在知名美元基金晨兴资本任 EIR,并以个人身份参与十余家公司的管理咨询工作;2015 年,王颖奇创立 ONES,致力于提供企业级研发管理解决方案。

摘要

在国内仍然处于初级阶段的大数据跑道上,创立三年的神策数据不断受到资本的青睐。最开始,神策数据想做的就是私有化部署。「我们的定位不是做一款 SaaS 产品,而是为企业提供深度用户行为分析的平台。」接受采访的曹犟如是说。

清华大学计算机硕士毕业的曹犟最初供职于百度大数据部,后来担任极路由的数据总监,再与其他三位合伙人一起创立神策数据,担任神策数据 CTO 一职。起初客户需要 iOS SDK,曹犟就买书自学写 iOS;随着客户越来越多,曹犟就跟着销售团队一起见客户……从做数据到做管理,曹犟正在逐渐转换人生的角色。

本期对话 CTO 请到了神策数据 CTO 曹犟,关于数据分析行业未来还有怎样的想象空间,曹犟聊了聊他的看法。

机器能解决的,就不麻烦人了

颖奇:很高兴神策的 CTO 曹犟同学能接受我们的访谈。首先可以讲一讲神策在数据分析领域,从技术上面有没有跟别的公司的一些差异?

曹犟:差异还是挺大的吧,我觉得主要是几个方面。第一点是技术细节,比如我们选择的存储跟查询是不预聚合的,所有的数据来了都是一条条的存起来,然后做任何一个查询的时候,都是从最细粒度的数据来查。这样做的好处是查询的能力灵活,我们的维度指标可以任意选择,非常多的分析模型,比如漏斗、精确的留存、归因分析,如果通过预聚合的方式都是很难解决的。第二个好处是时效性,比如收到一条数据,我们基本能做到十秒之内它就能在查询接口上体现出来。但不做任何的预聚合的挑战是,对于查询、存储以及数据扫描能力有非常高的要求,这是我们整个后端研发团队主要的攻关点。

第二点是我们认为数据采集应该是从需求倒推,先看需要数据用在什么地方,再决定采哪些数据,结合客户的整体技术架构,决定用哪一种数据采集方案。所以我们有专门的数据采集团队。我们发布了安卓全埋点采集白皮书,相当于贡献出了七种安卓全埋点采集方案的源代码。我们所有的数据采集的 SDK 和工具都是开源的,希望能促进整个行业的发展。

第三点是定位。我们不是传统的 SaaS 公司,而是企业服务公司,有点类似 ONES。同时我们绝大部分的客户都是做私有化部署的。

颖奇:其实 ONES 也是一样。大量的中小型公司还是会用 SaaS 的轻量级部署;中大型之后的话,我们的大客户都还是选择私有化部署。

曹犟:那我们这点还是挺像的。不过我们现在 80% 的客户是私有化部署,20% 是做 SaaS,我们可能跟很多公司不一样,我们最开始没有 SaaS 版本。

最开始我们就想做私有化部署,有几点考虑。第一点是帮助企业实现数据资产的积累。第二点是消除客户安全隐私的顾虑。早期我们的客户以创业公司为主,客户对于安全隐私不是特别在意。后来做到了金融行业,他们都有很多的合规的要求,而我们从一开始就是做私有化部署的,所以现在在这一块做的比较顺利。

第三点还是定位。我们对自己定位不是一个 SaaS 产品,不仅仅是一个数据分析产品,而是一个 PaaS 平台。我们非常看重客户是否能够基于我们的产品和系统去做对数据的深度应用,能够直接访问到原始数据,直接利用我们的存储和计算资源。我们搭了一个数据平台,客户可以写自己的 MapReduce、Spark。我们关心客户的内部系统能不能跟我们的做对接,所以将自己定位成 PaaS 平台。

以前我们只有神策分析一个单一产品,今年我们发布产品矩阵,就相当于把神策分析里面一些抽象的或者说一些公共的数据处理能力,从采集、传输、存储到查询给抽象到了底层,然后神策分析就变成了这个平台之上的一个应用。同时我们还有神策智能推荐、神策客景、神策标签管理、神策自动化运营,它们是共用下面的平台提供的数据处理能力的。

颖奇:刚才您讲到我们现在在服务几百个客户的私有化环境,那请问神策是怎么样来去监控或者说是维护、更新,来使得这些差不多大几百个实例都能够稳定运行呢?

曹犟:首先系统本身的鲁棒性和本身的可恢复性,或者说本身能够持续的运行的能力肯定是要比较强。第二点是说,有点像以前 Google 的 Burg,或者说百度一些类似的系统。在客户允许的情况下,我们会去监控这些系统的运行状态,不会拿客户的隐私,出了故障之后通过我们跟客户协商的几种不同的通道把这个故障给报出来。第三点是安装部署。但是对我们来讲,产品设计上早期就是只有私有化部署版本,对公有云上面的各个组件没依赖,再加上我们在这一块又做了非常多的自动化的工具。这也代表了我们一个理念,能用机器和程序解决的问题就尽量不要让人来参与。

颖奇:那神策现在真正做产品技术的团队是不是一些做核心产品,还有一些可能是面向客户的?

曹犟:我们团队不是这样划分的,我们没有定制开发,所以我们的实施会比较轻,实施主要是负责整个环境的搭建部署、数据的接入、数据的校验、产品的交付,更侧重于怎么样帮助用户用好这一块。因为客户有时候会对我们的技术特别好奇,研发会跟客户沟通,同时研发也会兜底解决一些技术问题,但是整体上研发是专注于我们几个产品本身,所以我们大概是分为产品、后端、前端等几个团队。

颖奇:那您觉得神策在团队风格上有什么特点呢?

曹犟:从整个团队来讲,我们在技术上是很开放的。对于销售的要求也都是能讲技术实现,能演示产品。同时,跟销售配合打单的不是产品,我们是有技术售前跟业务售前。业务售前更多的是更详细的来给客户传达我们的产品价值,具体在哪些方面能得到怎么样的一个价值,能发挥它的作用,怎样提升效率,怎样节省成本等等。

技术售前都是技术上非常全面的人,我们的技术售前的职责包括 POC,他们是要直接干活,他们直接要去登机器,去安装去部署,有问题去查日志,去查记录,去写 SQL,然后去做类似于写一些工具来导数据等等。

从写代码到做管理是一种强烈转换

颖奇:接下来可以讲下您个人的履历。

曹犟:08 年刚去百度的时候是在百度知道团队做个性化推荐、做检索,然后就跟文锋、力力、耀洲,就我们四个神策创始人,慢慢的就变成到一个团队,先做百度日志平台,再做用户行为分析。后来又做了 UDW,就是用户数据仓库;做了 User profile,就是用户画像;做了 ID-Mapping 的相关的一些工作。14 年 4 月份我离职去了极路由,做技术总监。15 年就我们一起创业做神策。

颖奇:那听起来的话就是一直是在做数据相关的。

曹犟:对,一直是在做数据,并且我之前一直是做技术不是做管理的。在极路由虽然叫技术总监,但也还是自己写代码。一年以前我还在写代码,但是现在没有时间(写代码)了。

颖奇:大概花了几年时间去做一个这么强烈的转换,大概两年半的时间?

曹犟:对,我觉得这个还在转换过程中吧。我一开始在神策负责 DataLoader,其实就是数据导入。后来我又去学写 iOS,跟另一位做机器学习的同事参考国外开源的 SDK 分别做 iOS 和安卓。随着接入更多客户,我就承担了相当一部分的售前工作。后来团队从只有研发逐渐的扩展,运维、技术支持、售前,再到项目经理、实施工程师。团队的组建不是有意识的招人,而是跟着需求来。人越来越多,逐渐没有办法把精力放到写代码上,自然而然地就不再写了。

更大的需求在产业更深处


颖奇:那我们讲讲您对整个数据分析这个行业未来的一些看法吧,关于这个行业将来会怎么发展?它在整个大行业里会产生一个什么样的效果?

曹犟:数据分析,或者说我们做的用户行为分析这个行业,过去三年我们也赶上了好时候。一方面是行业竞争激烈,客观上需求在增长;另一方面包括我们一些友商在内,很努力的去教育市场。从互联网行业向外发散,非互联网行业,像银行、券商、航司,他们都对这个概念是有意识的,精细化运营、数据驱动、增长黑客他们都觉得很好,所以我们是碰上了一个好时候,用户行为分析理念会越来越深入人心。这是第一点。第二点是落地的要求也会越来越高。对于互联网行业,只要提供一个好用的工具,工具做的效率很高就能用起来。传统行业虽然也有意识,但是帮助他们来落地,工具再好用都不够。这就是我们的服务越来越重的一个原因,所以落地也会越来越难。

例如《跨越鸿沟》的理念,一开始只有小部分人最愿意尝鲜,思维最活跃的那部分人用,你的服务会很轻。现在我们正在慢慢地跨越鸿沟,从早期尝鲜者到早期大众,但是早期大众用这个东西可能就需要我们提供更多的东西,不仅仅是一个工具,还需要好的方案、案例,别人怎么用的,同行怎么用的,互联网公司怎么用的,这些事情要求越来越高。

颖奇:那我能这么理解吗,您认为整个的数据分析行业将来是会比你们在最早期创业的时候想象的空间还要大。

曹犟:要大很多倍,我们早期认为只有互联网公司才会用我们的产品。现在我们总结就是,如果对方有一个线上的服务,不管是 APP 还是网页还是小程序,只要对方所在行业有充分的竞争,甚至像 CCTV、人民日报,这些都是我们的客户,最早很难想到。

颖奇:其实这个跟我们现在做 ONES 这个产品是很像的。早年我们认为可能客户都是做 APP 的、做研发的,但是现在包括你刚刚说的人民日报,他们也有来采购我们了。

曹犟:对,这个从钉钉就能看出来,他们也覆盖了很多偏传统的一些企业。我觉得这是一个很好的事情,因为客观上我们是帮助整个社会、整个大的行业提升数据的使用效率,我们企业的愿景就是往这一块。

颖奇:ONES 实际上也会讲到愿景,我们的愿景是帮助客户更好更快地发布产品。我们也可以来聊聊神策的愿景。

曹犟:神策的愿景是重构中国互联网数据根基。我们最早主打的神策分析这个产品,客户肯定会用得服务越来越深,会越来越到传统的行业里面去。但是从另一个方面来讲,这里还有一些新的需求。客户花这么大的代价采集了这些用户行为的数据,仅仅做分析,虽然分析能解决很多问题,但是也只发挥了 30% 的价值,剩下 70% 的价值,我们就有一些其他的产品。

颖奇:就要考虑要怎么用它,才能够真正推进业务增长。

曹犟:我们非常多的媒体、电商类客户有个性化推荐需求。零售、券商、航司客户有精细化、自动化、高效率运营高价值用户的需求,所以我们的自动化运营产品可以解决这些问题。「神策客景」则主要是解决像我们一类 SaaS 公司的需求,他们都面临客户续约的问题。所以我们还是用那一类数据,但是从不同的场景上来做了新的一些产品出来。

颖奇:就是从收数据、分析数据、看数据到用数据,真正的把这个数据用起来。我还想问一下,您最近有没有看一些觉得已经影响到您工作、管理或者技术上的书。

曹犟:我今年一共读了 74 本书,最近在看《重新定义公司:谷歌如何工作》,有几个观点我特别认可,例如 Google 的招聘观念是与其花那么大的代价招 50% 水平的人,然后花大代价去培养他们,希望他们能表现到 90% 的水平,还不如一开始就花大代价去招 90% 水平的人。还有薛兆丰的《经济学讲义》,也有一些很好的观点。平时我也会做书评、读书笔记,会把书里好的部分记录下来。

颖奇:好的,今天有很多收获。非常感谢您的分享。

本文作者:王颖奇,联系方式:[email protected]

相关推荐