桑文锋:首席增长官从数据思维驱动产品和运营

2007年,我从浙大研究生毕业后去了百度,之后是在百度做了8年。头一年是在百度知道做研发,从第二年开始做数据相关的事情,这一做就做了十年,在百度干了七年多数据的事情,从0到1去做百度的数据平台。

2015年4月我从百度离开,开始创业,创业做的事情还是围绕用户行为分析、大数据分析这个方向,可以说这十年时间对数据的认识越来越深刻,因为跟许多企业打交道交流比较多,对它的价值、实际的应用场景,也看得更加清楚一些。

今天我给大家分享的内容,主要是五个方面。

一是数据思维到底是怎么一回事。很多非技术出身的朋友,或者之前没有做过大数据,如果我直接将技术,中间跨度太大了,需要有一个缓冲地带,我希望这个缓冲地带能帮大家导入进去,之后会讲数据分析的价值。我们谈大数据,谈数据分析,到底它有什么样的价值,我给大家聊一下。

之后讲一个相对枯燥一点的内容,但是又是必须要了解的,就是数据分析,它整个环节是怎么一回事,让大家不管是不是要从事这一块,比如你做一个产品经理,做一个业务人员,在跟技术打交道的时候,你知道它是会按照怎么样的思路去做下来。

其次,是围绕两个角度,一个就是我们在做产品的时候,数据怎么帮到你。另外是我们在做运营的时候,数据怎么帮到你,最后,我也会讲一个,结合互联网金融的一个场景,详细讲一个数据分析的例子。

桑文锋:首席增长官从数据思维驱动产品和运营

穿越历史看数据思维

首先讲一讲穿越历史看数据思维。我本身是一个工科学生,研究的就是可以说是技术类的东西,同时我又比较喜欢历史,我对历史的东西研究也非常多,特别喜欢的一段是楚汉争霸,到近现代,最近半年我还学了半年党史,看了一段《毛选》。

在这个过程中我发现,数据分析、数据思维、大数据这些词,给人最直观的感受,是这些东西都是从国外来的,中国人自己是不提这些东西的。但不提这些东西,是不是就代表我们在这些历史上就没有人这么运用呢?我研究之后发现不是这么一回事,在中国历史上,其实有很多人,或多或少在用数据帮到他,只是他不会用数据这个词。

咱们先来看一个人物,萧何。刘邦去打败项羽,可以说依赖了三个人,一个是张良给他运筹帷幄、出谋划策,一个是韩信,给他攻城掠地,另外还有一个,就是萧何,给他治理国家,就是真正去帮助他运营的。

当时刘邦是比项羽先打到咸阳的,打到咸阳之后,刘邦手下许多都是无赖,上去之后就是抢金银珠宝去了,但是只有萧何没有干这样的事情,他是直接去了一些丞相御史家里面去,不是去抢金银珠宝,而是去抢书,抢这些材料去了、之前这种税收记录、地图、各地的统计数据,他都拿过去了。拿回去之后呢,搬到了自己军营里面去,之后就开始做研究。

等到后来项羽并没有把刘邦封为秦王,只是把巴蜀、四川那一带给了他。其实这个时候,刘邦是很愤怒的,说按照之前楚怀王的意见,那我应该是做秦王的,你现在只给了我一个边角料的地方,所以就想反了,然后其他人劝不住。

后来萧何就跟他说,你是愿意死呢,还是愿意去做一个巴蜀的王呢?他说这我怎么死了?我跟他拼一拼。他说你跟项羽去打,你的胜算如何?刘邦想一想,不行。然后萧何就给他分析,虽然巴蜀这个地方是比较偏,但是我通过研究这些材料,发现其实这些地方整个税收情况,交税,整个经营情况还是不错的。如果我们在这块,借助这块地方,我能保证带着你一块儿再去打回去。

并且给他提了一个建议,他说我发现汉中这个地方,当时叫南郑,这个地方不大,但是它的战略意义比较厉害,并且这块聚集了很多人,如果我们能拿下这块地方,那对他之后,咱们再往外打,这个就非常重要了。

结果刘邦就拿了一笔钱,金银珠宝,给了张良,张良又拿着一笔钱给了项伯,项伯又拿着这笔钱然后找项羽去了,说项羽,你看本来也没给人家做秦王,现在把南郑那一块地方给他行不行?

然后项羽这一介武夫过去就知道烧杀抢掠,根本不知道每一块地方,到底实际数据情况怎么样的。好了,就把这一块给他了。结果刘邦就几个月之后,明修栈道暗度陈仓打了过去,然后又过了几年,把整个天下都打下来了。其实这就是数据的作用。

萧何就知道要及时去收集这些数据,还要分析这些数据。那这里呢,我就总结了一下,萧何他作为一个当时的丞相,其实他是承担了很大的数据分析师的作用,他在哪些地方做的比较好呢?

我总结有三点:

  • 第一点重视数据收集。不是说等到你要用这个数据的时候,你才知道数据太重要了。而是在开始的时候,每去干一件事情的时候,都在想这里有哪些数据我能收集起来,以备后用。
  • 第二点,重视数据分析。不是等到刘邦说,萧何你过去把这个数分析一下,看看里面有什么结论可以用的,那不是等指导他的时候,他去做。而是刘邦没有指导他之前,他自己就已经在做这些分析了。只是说刘邦正好遇到事的时候,萧何把自己分析的结果给他,直接让他用。
  • 第三点,提供决策指导。不只是说把这些数据呈现给老板就行,你还告诉他该怎么决策,直接提供指导性的建议,并且在这些实际建议中去付诸实践。

后来刘邦跟项羽打的过程,可以说十战十败,许多的时候都是打的光杆司令一个,但没有关系啊,萧何在关中,直接给他运钱,运粮,运兵员,让他源源不断地打过去。但是项羽呢,就是流寇,后面没有根据地,没有人给他搞运营,没有人给他搞数据分析,这个结果就是很不一样的。

“毛邓”数据观

咱再看近一点的,毛泽东很厉害,这个毋庸置疑,大家有没有想过这个问题啊,我因为做数据的,然后我最近半年又因为看了《毛选》,所以我就在思考里面到底有什么共性的关系,然后我就发现一点。

其实毛泽东在数据分析上是非常牛的。有一篇文章,至少80后应该在课本上都学过,就是没有调查,就没有发言权,那是一个节选,就是节选这个《反对本本主义》这篇文章。

这篇文章讲的核心观点,就是你不能拍脑袋,你应该基于调查研究,并且里面说了一句话,就是调查就像十月怀胎,解决问题就像一朝分娩,调查就是解决问题。

他讲的很清楚,许多时候,我们调查研究,做的只要足够充分了,答案有时候很明显了,但是如果你没有做这些事情,前面就来到一个地方,什么情况也不知道就拍脑袋,那这个问题就非常严重了。

大家如果看《毛选》的话能够看到,最开始几篇是讲什么呢,中国社会各阶级分析,湖南农民运动考察报告,还有包括没有加入到毛选里面的,像雄武调查,还有其他的一些调查,就是毛泽东早期的时候,其实做了很多的调查研究。

我问大家一个问题,调查是什么东西?调查其实就是数据收集。我做了这十年数据的事情,抽象来讲,数据分析是很简单的,它只有两个步骤,一个步骤就是数据采集,一个步骤就是数据分析。

其实我们许多时候,我们自己在做决策的时候,大家可以想一想,你是怎么做决策的,你是不是先要去搜集一些情况,了解一些信息,然后再去做决策,就像当年红军打仗一样,前面要攻打一个县城,你带了一个连的兵力,然后不知道前面什么情况,来,兄弟们跟我上,然后冲进去了,结果人家里面驻扎了两个团,一进去,被人家灭了。或者说,你这个看到前面一个城不敢打,说咱们后援部队没来,这个等来了一块去打,结果他实际里面可能没驻扎军队,你这个过去之后,直接就一百多个人,就把县城给拿下了。

所以这里面为什么会有这样的一个不确定性呢,这里面就是数据的差异,你掌握信息,掌握数据,跟你做决策,那是完全不一样的。

其实对于什么是数据,其实数据就是信息,什么是信息呢?现在是信息时代,信息时代是谁开创的?是一个叫香农的人开创的,香农是信息论之父,咱们现在下载一些东西都是Bit,Bit单位是香农定义出来的。他是定义了一个信息的单位,每一个最小信息单位就是一个Bit,然后他对数据做了一个定义,对信息做了一个定义,信息是个什么东西?信息是一种消除不确定性的东西。

比如说,我手里握了一个硬币,我问你,这个是正面朝上还是反面朝上,你没办法判断这个东西,你可能猜50%可能是正面,可能50%是反面。但是呢,如果给你一Bit信息,就是已经告诉你正面朝上了,那你猜的时候100%是对的,你直接就拿到这个结论,其实这里面就是有了一Bit的信息,就是因为你掌握了一点信息,然后你对这个事情的判断,要精确了很多,这个就是数据的价值,信息的价值,就是消除不确定性。

我就发现毛泽东有三点做的比较厉害的。

  • 第一点,重视调查,没有调查就没有发言权,就是你不管干什么事,先做一下调查,不要拍脑袋,不要凭感觉去做,不要乱说一通,先调查一下情况。
  • 第二点,就是雾里看花的本领,你收集了很多数据,收集了很多材料,往那儿一摆,然后你看着晕了,看不出门道来,毛泽东就不一样,他就看到里面一些特点。
    • 当时军阀之间混战,今天湘系跟桂系打,明天桂系跟粤系打,打来打去,大家看不出个门道来,但毛泽东他就看到一点,这些打来打去,归根到底,是因为后面的帝国主义不一样,他们之间是争夺利益的,这些打斗的过程,其实是一个军阀割据的局面,只要他们长期打下去,中间就会有夹缝,有夹缝就有革命的根据地,就有地方,所以他就要在夹缝中建立革命根据地,这是他看到的。
    • 等到抗日战争的时候,许多人觉得中国完了,打不过,有些人又觉得我们坚持一下,很快就要胜利了,也不出三个月,半年我们就能胜,都是这样的观点,但毛泽东总结,局面不是这样的,日本国力是很强大的,但是他个头比较小,中国是比较贫弱,但是地方比较大,这个情况,如果它打过来,咱往后退一退,打一打往后退一退,退到一定程度,他的兵力就分散了,分散到一定程度,他就强弩之末了,我们反过来去攻打他,所以这样会是一个比较持久的过程,所以他判断整个趋势是持久战。
    • 这是毛泽东很厉害的一点,就是不只是说他去调查研究去搜集这些情况,你还要看到这些情况,这里面有一些特别的地方,就是值得利用的。
  • 第三点,是革命乐观主义,光有前两点,整个革命过程不是说一帆风顺的,很多时候是负面的信息多,许多时候都不行了,就像林彪觉得红旗到底能扛多久,但是毛泽东看来就是星星之火可以燎原,同样一个事,看法是不一样的。

创业其实也一样,我自己创业这三年,我自己总结都是,好消息一个,坏消息一个,或者十条消息里面八条是坏消息,那你怎么办?不过了吗?这个不是这样的。你要去自己去激励自己,激励自己的团队,就是觉得这种局面一定是可以改变的。

另外,邓小平数据思维也挺牛的。1978年,解放思想,实事求是,团结一致向前看,他自己写的文章。其实邓小平确定了一点,就是以经济建设为中心。那怎么以经济建设为中心呢?他又提了一个数据指标,GDP,就看这个数,不管黑猫白猫抓住老鼠就是好猫,你只要把这个数弄上去就可以了。

咱看一看效果啊,这是我从国家统计局上面截出来的数据,1978年的时候GDP,然后到现在2017年,每年8%往前涨,涨到现在,一年产生的GDP是1978年的225倍,你说这个差距有多大。那现在当然大家觉得这个生活确实比之前好了,你说数据有没有起到作用。

虽然说,当然我们定一个指标,比如污染,或者其他方面带来了问题,但是你如果没定这些指标,你可能什么也没搞起来。

再来说一个小例子,我今年春节的时候,去参加了自己学校一个入学20周年(聚会),我1998年上高中,当时整个高中是一年差不多入学的有500多人,后来学生越来越多,因为我们是最好的县高中了,许多学生都挤到哪儿去。所以它就得扩招,越扩越多,等到最近那几年,一年收2400个高一学生,这量就很大了,后来一个学校就撑不住了,就开始分成两个学校,新校区和老校区,当时一个是老师分成了两组,然后一个新校一个老校,两个校长挑人,你挑一个老师,我挑一个老师,这样分开了,学生也分成两组,新进来的学生按成绩排名,第一名在A学校,第二名在B学校,第三名在B学校,第四名在A学校,就这样尽量平均的分开。分开之后,等到三年之后,高考看成绩,两边升学率是有比较大的差距的,那说明什么?说明整个两个老师队伍其实是有差距的,你要说学生都是平均分的学生,这是一个很简单的数据分析例子,对比AB测试。

还有我去年8月份的时候,去敦煌参加过一次创业戈壁行,就是三天走一百公里,出发的那一段,就是当年唐僧西天取经出国的那一段,很苦,整个就是戈壁滩,沙漠,在这种环境下,然后每天平均来说30多公里,跑过马拉松的知道这种难度有多难,如果没有跑过的,其实我说很难,但是你很难理解。但是大家在实际在做一些高强度运动的时候,肯定会有感觉,比如说你脚上起泡了,这起泡其实就是一个关键的指标。我当时就做了一下统计分析,一共参加了有200个人,我没事的时候,我就找他们问,我说你脚上起了几个泡,第一天起了几个,第二天起了几个,第三天起了几个,左脚起了几个,右脚起了几个,我就拿一个手机,用这个Evernote就记了一下,让大家把这个数据报给我。

我一共差不多问了30多个人,当然没有全部去问,但这里面也看了一些有趣的规律。第一天的时间平均一个人脚上起一个泡,两只脚。第二天的时候呢,平均有两个泡,第三天有三个泡,并且发现呢,右脚起的泡,平均比左脚要多一些,那是不是大家在走路的时候,右脚更容易用力呢,这当然是有可能。其实这就是用数据去说话的一个例子。我们有一个简单的数据,大家看一看,是不是我说强度很大,我用数据说话,你就知道,你自己想一想,你自己走路的时候,什么时候起脚泡了,这个强度就出来了,这就是数据的威力。

前面不管从历史上还是从现代,从我个人,讲了几个例子,大家可能对数据分析能有一个认识,就是数据分析这种东西,不是一个高不可攀的东西,它的威力,可能高到国家层面,也可能低到你生活的琐事里面去,其实数据它是一个普遍存在的东西,而数据这种方法呢,也很简单,数据采集,数据分析,采集的手段,有可能用机器去采,有可能去人工去采,比如去开个调查会也可以去采集,或者我这儿问一下,也可以去采集,但是方法也不重要。

重要的是有你这种数据思维。就是你在这些工作生活里面去,你能去想到,我用数据帮助你,去解答这个问题,它更加科学,更加理性去看待它。

数据分析的价值与现状

接下来我们就看数据分析到底有什么样的价值,然后我们现在都会遇到什么样的问题。其实我在百度,因为整个做数据过程中,又加上创业之后,我自己直接打交道的就有几百家创业公司,打交道的过程中,我就慢慢在总结,数据的价值到底是什么。我总结了两点,一点就是数据去驱动决策,就是帮助你拍板的,我前面讲的这些历史上的这种例子,都是说我有了数据之后,更好好的去做决策。

不管做一些商业决策,产品中战略上的东西,或者说我们做一些产品的迭代,产品设计,这种运营监控的事情,有了数据之后,就帮到你更好的做决策,然后比如销售,一个销售的情况怎么样,我们这种团队管理,都可以去用一些数据来说话。当然更多的就是给人去使用,有数据之后,然后你去拍板,去做这个决定。

但在我看来,这只能发挥数据20%的作用,数据更大一个作用呢,在另外一块,就是数据驱动产品智能,那什么是产品智能,或者说什么是智能,现在人工智能比较火,大家怎么理解什么是智能呢?比如说一个门,它上面装了一个弹簧,我推它一下,它开了,然后它自动又合上去了,这叫不叫一种智能,那什么叫智能呢?其实我总结智能是这么一个模式,首先有了一堆基础数据,然后在这上面套上一定的策略算法,再把结果回馈到产品里面去,这让产品本身具有一种学习能力,就是自我迭代,比如典型的例子就是今日头条。今日头条,因为你看了几个花边新闻,它就专给你推花边新闻,它训练你这个模型,你点的越多,他就知道你对这一类的感兴趣,然后把这些地方就强化,去强化你这个,用专业话讲,去做推荐。这其实就是典型例子。

比如说百度去做竞争广告,你收的东西进来给你匹配感兴趣的广告,这里面都是用了这种学习,这种产品智能的方式。所以这一块,跟前面说的去驱动决策有什么区别就是,一个是给人用的,一个是给机器用的,就像今日头条,不是说后面有个编辑,整天给你匹配到底有什么新闻,发给你,不是这样的,是它是靠机器学习,自动的做这些事情。

因为产品本身引用了数据,里面用到了数据,用到了这种产品智能的价值,那就跟之前我们去看一个新浪新闻、搜狐新闻有本质区别了,这是今日头条现在它的市值,一个估值已经非常高的状态,就是它实实在在的在创造新的价值。

所以这就是说,我们谈这个数据的价值,在我看来就这两点。那我们在想这种大数据时代,这种数据分析,对我来说,对你个人来说,到底有什么用,就是这两点。就是你要考虑的是,在你的工作,在你的生活里边,特别是工作里边,我们怎么能用数据帮助你更好的做决策呢,我们怎么能让我们产品本身,让因为有了数据,价值更加高呢,这就是我们思考的点。然后那我们真正去让一个企业去实现数据驱动,让数据分析真正帮到你,而不是说我这个公司,我能出几张报表,就叫数据驱动的,不是这样的,它是一个逐步渗透的过程。

那么理想状态我觉得是应该,一个是全决策,我们期望再一个企业里面,不管是产品也好,运营也好,市场也好,销售也好,就是各种各样的决策,大家都能用数据去说话,数据去帮到你。

第二点,就是全渠道,那我们现在,线上就不用说了,互联网这些公司,用数据用的比较好,线下其实许多时候我们是用不好的,为什么用不好呢?因为你数据采集条件不具备,许多时候数据搜集不上来,搜集不上来你后面怎么去用呢?当然这种局面,也是在变化的,现在就是各种摄像头技术,我觉得也就两、三年的时间,两、三年之后,可能整个通过图样识别去解决一些,比如咱们今天开这个会,大家不用签到,自动识别一下,就帮大家都统计出来了,这个事都会变得非常容易,只是现在这个技术还没那么成熟。但总之呢,我们会期望,怎么去把线上线下这些所有渠道的这种数据,都能给它收集起来。

第三点,就是说全流程,就是我们期望任何一个企业,其实你都是一系列的环节,你的工作都可以总结为一个流程,比如就拿我们神策数据来说,我们就是前面有市场,去吸引潜在的客户,有销售去做转化,转化之后,我们有交付团队去做交付,后面有客户成功,然后保证客户去用好,它就是一个流程的过程,那我们就需要考虑的是,这个过程各个环节,我们能不能通过数据去帮到你,然后真的让你这一块的业务变得更加的好,这就是说这个数据一个全流程,全决策,全渠道,去实现数据驱动。

但是在实际过程中,在我们真正去做的时候,问题就非常多了,比如说,你只有宏观的数据,然后我们看一些整体的情况,但是等到比如昨天,我们活跃用户数跌了20%,你又会想查,这20%到底是怎么跌下来的,那你就要去看一些细的例子的数据,比如我们按照渠道拆开,按照地域拆开,去看这些数据,但是这个时候如果你没办法去看一些精细化的数据,那你就没办法去决定到底这个问题出在哪里。也有可能是,你不同的部门,市场部门掌握了一部分数据,然后销售部门掌握了一部分数据,或者产品团队掌握了一部分数据,等到你想用的时候,要跟各个部门打交道,去审批数据的权限,等审批到了之后,又发现这个数据ID又没有打通,我们又没办法把这些数据真正的关联到一起去使用,这些都是实实在在的问题,就是它真正在一个企业去落地的时候,挑战还是非常大的。

就像我自己,我在2015年,最早考虑创业,我觉得我未来要去把中国的数据底子打好,去重构中国互联网的数据根基,经过这三年的努力,如果说开始的时候我觉得离目标有十万里,现在我觉得有十万八千里,就是真正接触下来之后,发现其实这个数据底子比我想的其实要更差一些。然后大家的数据意识呢,还是要更弱一些,这里我们要做的工作就更加多了。

那理想状态是什么?理想状态我总结就是说,真正的自助式的数据分析,就是让业务人员真正去掌握数据,不是说好一个公司里面,老板想看数据的时候,由工程师帮你跑数据,然后其他一个产品经理,运营经理想看数据的时候,就没数据了,或者提了数据之后,过一个月才给他这个结果,你说这个效率是怎么样的。

更好的情况是,我们一个公司里面,业务人员各个角色,大家想用数据的时候,都能够去进行交互式、自助式的就去完成这些事情,那这个效率就要高很多了。

那这个常见的一种模式,我就把它归结为是需求驱动,往往是有人提出来数据分析的需求,有工程师,从杂乱的数据里面想办法去满足需求,然后整个交互过程,整个周期可能花几天、几周才能满足一个需求。

更理想的状态就是我们反着来,就是我们先要有数据基础,应该把数据底子怎么更全更细的做好,去采集好,然后在这个基础上,提出自助式的分析平台,之后让业务人员可以自助式的去完成这些数据分析的事情,从一个几天去满足一个需求,变成几分钟,几秒钟去满足需求,那这个效率就高很多了。

我觉得互联网思维最核心的就是迭代,不是说你做一个东西别人做不到,而是说你比别人迭代的快,就是这个手机,比如现在智能手机,大家会觉得,好像再往前发展,没啥发展了,它发展到一定程度确实会那样,就笔记本电脑,到底发展到哪一步,下一步会是怎么样的。它一种技术发展到一定程度,会进入一个理想状态。

其实整个过程拼的就是谁更快的到那个理想状态去了。人家苹果就是比你安卓的许多手机就是更快一些,那它就能收割,就是在一路迭代的过程中,他能卖五千,你只能卖两千,所以在这个过程里面,那迭代速度快与慢,那就是取决于你整个决策过程,决策的速度是不是够快,整个在产品开发,在做运营活动,这个环节里面,是不是通过这些数据,让你比别人更精确的很快找到下一步该是什么。而不是说花了六个月踩了一个坑,然后又花三个月,又从坑里面爬出来,那你这个速度从哪里来。这里面就是我们通过这种数据驱动的方式,让你效率变得更加高。

数据分析的四个关键环节

前面讲了数据分析的价值,还有我们现在存在的问题,接下来,我们看真正的数据分析,它有哪几个环节,简单来看,数据分析就两个环节,数据采集,数据分析,实际真正在去做数据分析的业务,其实我们会把它进一步去划分,可以划分成四个环节。

第一个环节就是数据采集,我们要把数据搜集上来;第二个环节,就是说我们要对数据建模,你不能说收集过来,就一个仓库,杂乱的把他们都丢进去,等到你用这个数据的时候,发现你找不到这个数据,你想要的东西拿不出来,这个也不行,所以这个时候,我们要对数据进行组织,我们要把它规范好,然后我也方便后面去用;第三个环节就是各种数据分析方法,围绕我们做数据分析的时候,围绕比如说漏斗分析,流程分析,围绕拉新客户,围绕流程客户,围绕其他的运营事情,我们通过数据分析去帮到你,这样的方法可能说有各种各样的。再往上一层就是指标,就是一些数据指标。比如对国家来说GDP就是一个数据指标,我们不能每天都要从源头去看看数据一条一条的剥离一下,看看问题在那儿,这个效率太低了。

更多的时候我们是期望定义几个指标,把它标记出来,然后我们就看着几个指标,如果没问题,那就问题不大。就像开车,前面有个仪表盘,仪表盘里面不亮红灯,开吧,问题不大。这指标就起到这么一个作用,我们把许多事情去简化了,通过几个简单的数,我们就知道整体运营的情况。

那我们先来看这个数据采集,大家都听过大数据,什么是大数据呢,我们怎么理解什么是大数据?其实这个问题,因为我自己就是从事大数据的,经常会有人问我,我回老家,一些亲戚,他们什么硬件、什么软件都不知道,现在又来了一个概念大数据,给我讲讲什么是大数据,你说我怎么跟他讲,讲起来难度是很大的。但是我也一直不断的在总结,也是在看书,包括对我影响比较大的是吴军,吴军讲《浪潮之巅》,讲《硅谷之谜》,讲许多东西。

其实我都在思考数据,什么是大数据,现在我对大数据的理解,两个层面,一个层面是从价值的角度来看,就是我前面讲的数据分析的价值,就是驱动决策和驱动产品智能,那是从价值,如果从物理层面呢,我又把它总结成四个字,就是大,全,细,时,就是数据分析这个概念,不是一个新概念,他可能已经存在几百年了,两三百年肯定是要有的,因为统计学出来的更早。

现在我们提的大数据,跟之前又有什么区别呢?其实就是说底层的数据源变了,其中一点,就是大,那大是什么大,比如说,我们把全国各个地级市今天的苹果价格,这个数收起来,每个地级市收一条,这个数一共加起来,可能两道大小,但是相反,我们如果把内蒙古草原上一台风机,它的振动数我们收集起来,一天可能有50个GB,因为那个数大?可能是内蒙古风机更大,是不是?但是内蒙古风机在我看来,它不是一个典型的大数据场景。因为你只能看到这一个点,就是它的情况你可以了解一下。但是,如果我们全国各个地级市苹果的价格,我们有一车苹果要运到哪儿去,你就可以做一个智能的调动系统了,这个价值就要大很多。

第二点就是说全,就是你许多时间了解一部分数据,你这个答案是有问题的,你可能偏了,你比如说去年的时候美国大选,大选之前,整个结果就是希拉里获胜的概率70%多,川普获胜的概率20%多,整体整个市场,它网上的调研,许多都是这么一个结论,结果出来之后,川普赢了,许多人都在分析问题出在那儿,后来分析其中一个原因就是美国中部许多农民,这些农民是不上网的,但是他们是支持川普的,你光在网上做这些调研,那你能调研准吗?实际情况你没调研准。

在我们实际工作中也是一样的,有时候你就是只看了部分的数据,或者有时候觉得老板不公平,老板就听谁说了两句坏话,就按照他的思路来做了,那这里面问题出在哪,就是因为你没有去把这些数据很全的搜集过来,你只是看了一部分。就像最近我在看一本书,叫《原则》,《原则》里面其实讲了一点概念就是极度求真,极度透明,就是说我们要把这些信息,尽量真实的去搜集起来,实质情况收集起来,尽量让大家共享出来,大家都能看到这个数据,咱再基于这个数据再去做决定,不要自己看了一两条信息,听了片面之词,然后就去做决策了,那种决策是不是就很容易出问题呢。

第三点就是细,比如说,咱们许多都是做业务的,我问大家一个问题,在你们公司业务里面,不同身高的人,他们在消费上有什么区别?你可能回答不了这个问题,为什么呢?因为你没有搜集身高这么一个维度,你后面就没有办法做这个分析了。所以说同样是数据,如果我们掌握的这种维度比较多,我们就可以围绕这个维度进行交叉分析,看里面有什么样的规律,然后去研究他,但是如果没有搜集,你就做不到这一点。

第四点,就是时,时效性,同样一个东西,同样一个数字,现在告诉你,跟两年之后告诉你,结果能一样吗?它是很不一样的。比如说美国发生金融危机了,如果你提前半年知道金融危机,你就可以做空,或者做多一些东西,你是不是就可以利用这个价值。双十一,然后你上午投的广告,很快发现效果不行,马上就调,这个广告不要投了,换其他渠道去投,是不是就省着等到当天晚上12点的时候,你发现咱们其实投错渠道了,这渠道根本没用,这是不是同样是一个数,时效性他这个作用是不一样的。

那这个前面是说数据,我们其实真正去做好数据,就是在考虑,如何去把数据更全更细更加时效性的收集起来,这是一个基础。

那收集数据有什么样的手段?因为我的背景主要还是做线上相关的,线上在数据采集的时候,我总结有三种方式。可能有一些偏技术的,大家简单了解一下就可以了。

一种就是通过可视化埋点,全埋点这种方式去自动去给他收集,然后去填进去,然后让他自动去采,这种方式好处就是不需要工程师过多干预,让这些产品经理,运营经理,自己需要就在上面配就可以了。

但是呢它有它的弊端,弊端就是数据搜的不够细,比如来说右下角有一个提交按纽,左上角有一个打七折,自动搜的时候,不知道打七折是一个有用的东西啊,但是你如果分析的时候,这就是很关键的一个因素。

第二种就是一个代码埋点,我们去在程序里面,客户端也好,服务端也好,在它关键逻辑里面,去嵌入进去,比如来说,用户提交了,提交运费是多少,成本价格是多少,这些都是维度信息,我们都去把它记录下来,记录下来之后,你做分析的时候,就方便了。

并且你许多时候采集数据的时候,从前端采跟后端采它是有差异的,为什么呢?前端容易丢数据,用户进行交互的时候,可能网络断了,网络不通畅,那可能就让你丢失了一页数据,但是另一方面,通过后台,如果这些系统之间,后台服务器之间交货,可能就没这个问题。

第三种就是说我们用工具导,比如来说你数据库里面的数据,比如说你从第三方拿到的数据,或者说你线下人工去输入的数据,其实这些都是有价值的数据,你也要把它引入进来,你就用工具去批量的,实时的把它导入进来,这就是互联网数据收集的方式。

然后当然线下会有一些区别,线下比如说通过摄像头,通过WIFI信号,通过红外线,通过其他等等,通过激光,通过各种方式去搜集,但本质其实没有区别,都是说我们要想一些办法,通过一些手段去把数据收集起来。接下来那就是数据要进行建模,进行组织,那正常来说,其实我们公司业务,你后面都会有一个数据库,数据库里面放了很多张表,表里面比如这个定单表,或者用户表等等,这个表里面存在了很多有价值的信息,那当然我们可以要求业务人员,你学习一下使用数据库吧,你学会使用SQL,怎么去做分析,那这是一种方式,当然这里面对于许多业务人员掌握这个东西太难了,因为你经常变,后台这些数据经常变,变了之后,后面就没办法去用这些东西了,所以我们要对数据进行一个再组织,对于互联网这种产品来说,比较好的一种方式,就是多维数据模型,就是OLAP。

比如说,这个是维度,这一个概念,比如北京,天津,上海,这是城市的维度,他有一些曲直,然后操作系统,他有MAC OS、IOS、安卓,它也是一些维度,然后这些维度之间可以交叉,交叉之后呢,可以去看一些指标,比如销售额,注册用户数,这样的话,就是我们不只是说能看一些宏观的数据,还可以看一些精细化的数据,比如来自天津的使用IOS的数据是怎么样的,注册用户数是怎么样的,这样的话,就是说我们又能看宏观的,又能建森林,又能建树木,那对你去做决策,价值就大很多了。

然后对于互联网产品,其实都可以去做一些抽象,比如用户去注册,浏览,下单,支付,收货,这是一个典型的电商的一个产品流程,其他的,互金的等等都是类似的。那在这里面呢,我们就需要去把用户,他进行的这些动作,都给它记录下来,包括一些维度,时间,地域,渠道,商品类别,商品单价等等,这维度都记下来,记下来,就形成下面这种表,一张宽表,有这个维度之后,我们就可以分析了。比如想分析来自江苏省的,然后看这个小米平板的,这些人到底有多少,你就可以灵活,但是如果你这个维度信息没有记录下来,你后面是不是就没办法做这个分析了,这就是说对数据要进行建模,就是进行组织。

之后就是数据分析,其实数据分析这种方法,有各种各样的,毕竟它不断的在扩展。那我们可以去从广度、从深度上来去看。广度上来说,我们是看一个用户的,还是看一组用户的,还是看整个全体用户的,这广度是不一样的。另外是深度不一样,我们是看一个用户的某一类操作,比如浏览操作是怎么样的,还是说我们要看这个序列,它先浏览,再支付,再收货,有这些序列行为的,这又是一种思维方式,就是分析方式。所以就是说我们会有各种各样的分析方法,解决这些各种分析的广度深度问题。

咱看一个简单的例子,这也是之前的一个例子,就是开眼,开眼是一个视频APP,他们当时就发现一点,他们去朋友圈,去微信群去分享的一些视频,但是真正去下载的时候发现安卓这种APP下载率是要远低于IOS这种APP的,然后他们就想分析这个原因是在那里,这个时候呢,那最直观的感受,我们就要切这个数据啊,看看安卓过来的,他们再切分一下,看看是不是有哪些渠道跌下去了,或者有其他这种特殊的维度带来这个问题,他们当时就做了一个分析,按照屏幕的宽高去拆开,然后拆开之后,就发现有某些屏幕宽高的下来率几乎为零,这个量是很低的,然后他们就去还原这个场景,还原之后,发现这种屏幕宽高的情况下,左边下载按纽是在第二屏的,第一屏就显示不出来,然后用户得翻下去才会下载,这时候自然点击量就低了嘛,但这些情况就是如果你不进行这种多维的数据分析,你就不知道问题在哪,这就是说,这种多维的数据分析带来的价值。

另外呢,比如来说我们做留存分析,我们其实许多时候花了钱,把这个用户拉过来,咱可不是想这个用户来了一次就走了,就再也不过来了,就这一锤子买卖,其实我们期望的是他后面会不断的留下来,比如次日他会不会过来,次周会不会过来,次月会不会过来,我们期望每来一个用户,巴不得他一直过来的,所以这个时候呢,我们就可以去做这种留存的分析,但是后面我会详细讲这一块,然后可以分渠道,比如不同的渠道,这个用户的留存是怎么样的。

然后我们也可以做这种漏斗分析。因为用户比如来说到你这个官网去浏览,去注册,然后最后购买,它都是一个流程,这个流程里面,它会进行一步步的,它是一个漏斗,一环一环的往下漏下去的,那可能某一个环节,用户就卡到哪儿了,卡到哪儿导致大量的流失,如果我们没有去做这个监控的话,我们不知道,我只知道这个整体这个用户好像来了之后没啥用,但你不知道某一环节,就是因为你那里让人家绑定银行卡,人家没绑定,就导致很多流失了,这个时候呢,我们就需要做这种漏斗分析,去解决这个问题。

数据分析的指标体系

再往上一层那就是指标,我们去看一些数据的时候,我们还是不能说什么事都自底向上这么搞一遍,那这个效率太低了,我们还是期望平常针对这个业务,去把它抽象一系列指标,在互联网另外有一本书,我推荐大家可以看一看,叫《精益数据分析》,它就是讲互联网产品如何做数据分析的。

他里面讲了一个核心观点,就是第一关键指标。就是对于一个产品来说,你在一个阶段,不能胡子眉毛一把抓,就是什么东西都抓,就像邓小平在搞中国建设,社会主义建设,他就抓一点,经济建设,以经济建设为中心,其实我们创业更是如此,你什么也想要,那你能得到什么,那这里其实就有一个问题,比如说你一个团队,大家对这个目标的认识,这个指标的认识是不是一致的,

我曾经做了一个调查,这是我去服务的其中有一个客户,它是一个在线教育产品,我说你们现在最关心的指标是什么?三个人,我说你们各说各的,一个说日活,一个说订单量,还有一个说访问深度,就是平均关键行为次数,然后我说,其实你看咱们就这么小的一个团队,其实大家的思路还是很不一致的,不一致的时候,大家努力的时候,去花工夫是不是花到不同点子上面去了,那所以这个时候呢,就是我们需要有这样一个第一关键指标,或者北极星指标,这个指标咱全公司这个阶段就是围绕他的,咱就提升订单量,好,大家努力,都是怎么去把这个订单量。创业公司嘛,你很小一个团队,更是要集中火力,大家围绕一个目标去努力。

我觉得它有三个阶段,你比如最开始的时候,你MVP,就是你产品没成型,就是在做一个Demo的时候,做一个最小可用产品的时候,你关心的指标是什么,等到你快速增长的时候,你关心的指标又是什么,等到后面你用户基数已经非常大了,你关心的东西又是什么,其实这个每一个阶段,它是不一样的。我们要考虑,我们自己的产品,我们自己的业务,现在所处的阶段是怎么样的,我们到底最关心的是哪一个,让大家集中精力,围绕这一点去做,比如像三只松鼠,这是一个在网上去卖零食的一个APP,那它比如刚做出来这个APP,还没什么用户,它应该关心什么指标?或者像Keep这样的产品,它已经用户数一个多亿了,在这种情况下,它关心的指标又应该是什么样的,其实它就会不一样。你不能说别人关心什么,你在你自己产品里面也这么去用,那这就完蛋了,这就是说你用的力,使的点是不对的。

刚才是讲第一关键指标,我们找最关键的指标,那另外一种思路呢,就是我们按照运营的五个视角去看,这种呢,就是海盗指标法,就是这个PirateMetrics,这是2007年的时候,一个叫Dave McClure一个人,他提出来的思路,到现在过了11年了,其实一点都不过时,我觉得他这个抽象还是非常牛的。

这里围绕用户,我们可以抽象成五件事情:

  • 第一件就是触达,比如我们做广告,让客户知道你。
  • 第二点事情激活,怎么让用户变成你真实有效的用户。
  • 第三点就是留存,我们怎么把用户去留下来。
  • 第四点是引荐,我怎么去让老用户给我推荐新用户。
  • 第五点就是营收,我们就不用说了,最关心的可能就是钱了,我们整体销售额情况怎么样,这些自然就是跟数去打交道的。

这是他2007年的时候画了一个图,我直接拿过来了,其实就是当时因为也移动互联网也没发展,其实这个用户比如通过PR啊,通过SEM、SEO去把这个用户获取过来,获取过来最后想办法去把他转化,比如变成一个注册的用户,然后之后呢,我们想着怎么去把他推荐其他的用户,去让他留下来,再从他身上赚到钱,这就是说,他牵扯到这个环节,那这个环节呢,我们都应该用数据去监控起来,看看我们这个产品,到底那个环节出问题了。

比如一个互联网金融的产品,我们围绕用户触达,激活留存等等,这些各个环节,其实我们都能定义出来一系列的指标。然后通过这些指标,我们就可以去监控整体去监控这个产品,不然的话,你只是凭感觉,我今天想到我们应该看看这个数,明天想到看看那个数,那你都不会对你的产品建立一个系统的监控,系统的监控,就是按照这种方法论去梳理,去看你到底那些指标,哪些关键环节出了问题。

如何“激活”用户

前面其实就讲了整个数据分析的四个环节,这个环节大家大致了解是怎么一回事就可以了。接下来咱们看一些具体的例子,然后看实际过程中,我们到底怎么去用数据。

首先来说产品迭代,那我们想一想,我们正常怎么做产品,是不是可以总结这么一个模式,就是我们拍脑袋想到一个点子,做了之后,再拍脑袋,再想到一个点子,再继续做,基本上就是你这个过程,这个过程呢,对于一些牛的人,确实挺厉害的,就是他总是能拍对,他的感知很牛,他许多时候,他能去做出来。

但是对一个新手呢,让他拍一下,错了,拍一下,错了。有可能经常做一些错误的结论。那这为什么会这样呢?就是因为咱开始讲那个问题,你没有利用数据思维嘛,有没有有什么东西支撑你,让你拍的更准一些。

这里面我们就需要用数据分析,我们要把这两环变成一个三环的过程,就是首先我们去学习,学习不管你从经验,或者说从其他方式中,有一个原始的起点,然后我们学习,有了一个点子,然后开始研发这个功能,研发功能之后呢,不是马上就去做新的点子了,去提新的功能了。

而是我们要做数据分析,我们做的这些功能,我们要用数据去衡量一下,到底符合不符合预期,然后哪些地方,哪些环节有问题,然后我们要把他做一个分析,分析之后呢,我们又得到了一些新的点子,在这个基础上,我们再去开发新的功能。所以这个过程,就让一个拍脑袋的过程,变成一个科学决策的过程。

互联网思维核心是迭代,迭代也是有科学依据的,就是你许多事物的发展,就是一个螺旋式上升,它是通过一个往前不断迭代的过程,我们在做产品迭代的时候,就通过数据分析去引入进去,让他这个过程变成一个科学的过程。

看一个例子,比如我之前是在百度知道,后来在2012年的时候,整个百度内部都要推移动化,许多产品都做了一些APP,当时百度知道也做了一个APP,然后当时就发现一个问题,其实百度知道上很多都是中小学生提问题的,就是他们问作业,发现里面有10%的人是问作业的,这就是通过数据分析发现了规律,发现了之后呢,我们就可以对产品做一个改进,怎么改进呢?我们加个按纽,让他专门问作业,点一下就直接问作业了,回答问题的人,也能直接去回答这个问题,这里显示有一点问题。后来加了这个按纽之后,就发现有30%的问题量是作业相关的,不是说人家之前问周杰伦的变成问作业了,肯定不是这样的,就是之前那些问其他的还是在正常的问的,但是问作业的就变多了。

有了这个数据之后,就可以进一步往前迭代了,于是专门做了一个APP,叫作业帮,专门就让你问作业了。结果这个产品独立出去之后,半年的时间,增长了500%,现在也是从百度分离出来的一个创业公司,发展的也非常好。其实这就是说,因为有了数据,然后你及时对一个公司来说做这个决策,它都是有据可依的,不是拍脑袋,凭感觉,去做这个决策。

那我们接下来再看运营,运营是什么,其实就是我们前面讲的,因为互联网产品重要的就是用户运营,不管运营的用户也好,客户也好,都是这些,对于一个产品,其实现在我建议一些创业者,我一般都会问他三个问题:

  • 你的客户是怎么来的?
  • 你怎么把客户留下来的?
  • 你怎么从他身上赚钱的?

就这三个问题的,这三个问题我问了之后,我就大致知道他这个业务情况怎么样,这个运转的是不是良好,问题出在那儿。

这里面只是把那三个问题细化,就是细化了一下,比如触达,激活,引荐,这些都是如何获客的,留存就是怎么把客户留下来的,营收就是怎么赚钱的,我们在这种分析的时候,我们做运营活动的时候,就是在关心这些点,只是说我们可以去把它,在这些环节怎么去做的更好一些。

我重点讲激活跟留存环节。首先来说激活,我们考虑一个问题,什么是激活,比如说一个互联网金融的产品,一个用户到你这个产品里面装了APP,这叫不叫激活,或者一个视频网站,他到了你的首页,然后浏览了两下,也没看视频,这叫不叫激活?然后一个电商网站,他过来溜了一圈,然后什么也没买,这叫不叫激活,或者说一个图片编辑的产品,他上去之后,就看了几张图片,没有做什么动作,这叫不叫激活,但实际情况呢,我们看我们的市场团队,就在以我刚才说的那些方式在衡量效果的,衡量做的好与不好的,我们看市场推广,花了一些钱,就看装机量,装机量就多了,但装机了就代表是你的用户了吗?这是不一定的,有些就是被这种积分墙或者什么产品,就网上装上去了,但实际如果你分析的话,许多用户他根本没有真正去用它。

所以那什么是激活呢?不是说装了APP,启动这就叫激活了,而是说一个用户,一定要体验到你产品的核心功能,那比如说12306这么一个产品,必须说买了票,他才知道12306原来这么有用。一个视频网站,必须让他看视频,看5分钟,他如果不看5分钟,他那知道这个产品好与不好呢?质量怎么样呢,所以这个过程,就是我们说所谓的激活,就是我们要千方百计想办法,更快的让客户感知到你的核心价值。

那我们在做一些市场活动的时候,我们在做一些运营活动的时候,就要以这个为目标,我们怎么能以这个去衡量,我们做的到底好与不好,不要只看一些虚的,一些虚荣的指标,实际到后面就打架了。比如市场团队觉得这个拉了很多线索,然后销售团队觉得你这个拉的什么线索,一个也转化不了,市场觉得销售你这个销售能力不行,销售觉得你市场这个做的不行,那为什么会出现这样的问题呢?关键是没有衔接起来,中间还差个坑呢,他光把APP安装了,就觉得市场就觉得完成任务了,销售后面还要做很多事情呢,这个体验的用户,他连体验都没有体验,感受不到这个核心价值,那你怎么去做这个,到后面去转化这个就非常难了,这个客户也不容易留下来,所以我们就要去思考,我们怎么去把用户去有效的激活起来。

这里面其实围绕这个用户激活,我们肯定能通过一些动作来去衡量,就是在一个产品里面,比如来说播放视频,超过5分钟,或者说他要发消息,就是说我们都有一些关键的动作,我们围绕产品,对这个用户的研究,我们会慢慢的就会发现,只要做了这些关键的动作,用户就更容易留下来。这里就会产生一个概念,或者一个称号,就是Magic Number,这个经验的数字,比如这个实际的例子,比如像Facebook,Facebook研究之后就发现,一个新用户,如果他十天之内关注超过七个好友,他就更容易留下来,更容易变成一个有效的用户,如果一个Twitter帐号,如果他follow了超过30个用户,他就更容易留下来,去观察他。

还有像Slik这样的产品,一个团队里面,他如果发送超过2000条消息他就更容易变成一个有效的团队,就是一个企业用户,大家思考一下这个背后的原因。其实你像Facebook,它本来主要是看朋友动态的,如果你连个朋友都没加,你看谁的动态去啊,这个Twitter,它是一个发新闻,或者说这些信息的,然后你都没关注人,你看什么新闻啊。Slik是一个团队协作的,都没人发消息,没人陪着你一起去,互相的交互,你能变成一个有效的用户吗?

其实看着很神奇,背后一个原因就是说,我们真的让用户变成一个有效的用户,让他尽快的体验到你产品的核心体验,所以我们要引导客户,赶快加好友,赶快让他follow一批人,赶快让他发一些消息,邀请他的同伴,让他们过来一起去聊一聊。所以通过这些过程,就是说我们让一个用户变成一个有效的用户,这就是激活。

以神策数据自己的官网来说,我们官网这么一个产品,然后用户来到这里可以浏览一下,看一看,可以体验我们的Demo,那你说,这个用户什么叫激活呢?他到我们官网浏览了一下,在百度上搜数据分析,然后跳到我们网站,这叫不叫一个激活的用户呢,那肯定不是了。他过来之后,注册之后,叫不叫呢?可能还不是。那我期望的是他要体验我们的Demo,那所以我们对一些产品改进的时候,我们就是要衡量这个东西,你不能衡量只是浏览量,好,我们上来一个新页面,看他浏览量是不是变多了,就觉得这一次改版是成功的,那这就不对了,我们一定要去衡量,我们一些关键的行为.

比如提交申请,这么一个过程,当然其实这里还是只是一个层面,我们可以更深的一层,比如到他这个体验Demo的程度,我们去把这些环节给他通过漏斗分析去记录下来,记录下来之后我们就分析,新上的这个版本跟老的版本,它之间是不是有一个大的变化,是不是真的在一些环节提高了,提高之后,那我们说,这次改版,它是值得的。

所以这个就是说我们关心的指标,在一些特别是引流,吸引新用户的过程中,我们就要千方百计把这个用户去,真正转化成一个有效的用户,这个有效的用户怎么定义,那不同的产品有不同的定义方法,还要结合自己的产品来去体验。然后前面讲的激活,激活是对用户触达,到变成一个真实的有效的用户,里面最关键的环节,我们要想办法,让它变成一个激活的。

如何把用户留下来

接下来一个问题就是留存,就是我们怎么去把客户留下来。那什么是留存,刚才我也给大家讲了概念,比如次日留存,周留存,复购率,这都是留存相关的指标,就是我们期望他不断的留下来,这个不断的回头客。对于留存,我们应该做什么?我总结有三点,第一点要关注留存,第二点要提升留存,第三点要利用留存。

首先来说,关注留存,我们为什么要关注留存,这里面就有一个简单的公式,我们是期望客户获取成本,是小于客户生命周期价值的,这个道理很简单,我们花一百块钱买了一个用户,结果你只能从他身上赚50块钱,然后你亏了50,这就是许多2014年的时候,O2O这些项目就是这个结果,做一单亏一单,做一单亏一单,做得越多,亏得越多,这其实就是问题。

我们许多时候我们是花钱买用户,但我们买用户是一个前提条件,我们是期望最终能从他身上赚到钱的,那这里呢,就是我们期望LTV,就是客户生命周期价值,是要大于这个CAC的,所以这里面呢,如果它大的,那我们就能够让客户,每一个客户过来,我们都是一个正向的滚动,相反那就是越来越亏,所以这个就是说一个基本的观念,所以我们要关心这个用户的留存。

比如来说像Keep这么样一个产品,它头一年半涨了5000万用户,Keep也是我们自己的一个客户,发展的非常好,反正我自己锻炼的时候,经常用Keep,就是那这个用户来了之后,那你其实不只是说来了,大家知道健身,瘦身这些东西是很难坚持的,装了APP,3分钟热度,练不了几天就坚持不下去了,那其实这个留存率就没那么好了。那所以我就看到这个Keep这样的产品,三天两头改版,引导上,激励上,他想各种各样的方法,怎么能激励你,让你留下来,让你坚持下来,然后给你换不同的花样,这个就是说你要去做这样的事情,挖掘这个用户整个生命周期的价值。

第二点就是提升留存。我们怎么能把留存提升上去,核心点其实就是两点,我觉得第一点,就是满足客户需求,你这个东西得是有用的,第二点,提升用户体验,实际上第一点就很直接,就是如果你这个东西没用,你即使通过一些花招的手段,把用户吸引过来,骗上来了,你觉得他会留下来吗?

2015年的时候发生了一件事,有一个小的产品叫足迹,就是发了一个电影海报一样的东西,下面加了一句话,你就可以把一张照片做出这样的一个东西,当时火了一阵,但后来没消息了,为啥没消息了呢?就是这个产品太单薄了,你发两条,体验了一下挺好玩的,然后玩了一下之后,你觉得没啥用啊,你不能整天发那个东西,然后那接下来呢,这个用户用的动力就没那么大了,所以许多产品就是这样,如果你给客户带来不了价值,用户用你没有什么用,他为什么要天天过来呢,为什么要反复去用你那个东西呢。

另外,就是用户体验要好,那有用还不行吗?还得有用户体验。这个问题就在这里,就是互联网产品,往往不是你一家来做的,往往是一堆在做的,你要做个共享单车,一堆做共享单车的,然后你要做个充电宝,哗一下,全地球都在做充电宝了。它许多时候,是有很多家做同一件事情,互联网的竞争它有一个特点,就是它不是零和一的竞争,就是有的东西只有你能做,别人做不了,往往是大家都能做,但是这里有区别,有的是60分,有的是90分,最终90分干掉了60分,不是说你做一个60分,人家90分,6比9这个市场份额,往往是1比99,你就只能占一丁点,所以这里面呢,就是体验要好,除非你这个产品是12306,独家的,垄断的,你不用我不行,你不用我,你就没办法买票了,这个它只要满足有用就可以了。

即使如此,大家有没有发现,大家发现12306迭代的也不错,最近我看加了一个功能,可以选座了,之前就不能选座,人家也是在想着怎么去把这个产品体验做得更好一些,所以许多时候,大家想着要国家有一些公共设施做得不够好,就千方百计先让他引到网上去,先按照互联网的玩法玩起来再说,玩了之后呢,就能改了,就有一个迭代的基础了。

那我们怎么去提升留存,其实提升留存有一些各种各样的手段,当然我这里只是随便列了几点,这个没办法穷尽,可以说有各种各样的方法,围绕你自己的产品去考虑。

比如来说做消息推送,我们到月底了,发现月活没满足需求,给他们推个色情新闻,哗一下这个量上起来了,但是这里有伤害,你光推这些东西,许多人一看,我又不喜欢看这些东西,我又给你卸了,把你这个推众给关了,你这里就得不偿失了。

其实这里面每一条动作,你不要觉得给客户发一个消息是免费的,然后这是没有成本的,其实你伤害的是客户的感情,这里面你要衡量成本,衡量价值,就是你到底给客户带来多大的价值,多大的伤害,需要评估这个东西,不能乱来。另外就是前面讲的魔力数字,就是激活的用户更容易留下来。

我们在分析留存的时候要考虑,我们怎么能让用户真正的使用起来,这是一个前提条件,所以我们要去改进产品的体验,要让这个过程更加流畅,让他更快的体验到产品的核心功能,那比如来说用户分群,我们要针对一些不同的用户,采用不同的策略,比如之前频度非常高的,现在频度忽然变低了,针对他们采用一个策略,或者说之前没怎么用的,现在忽然用起来了,针对他们又要采用什么样的策略,就是要把它用户分起来。

运营这个事情,理想状态就是针对不同的群体采用不同的策略,最极端的情况就是针对一个人采用一个策略,然后通过这种方式,把它定制化的去操作,去运营,比如流失的挽回,比如一些用户,已经半年没过来了,给他们发个优惠券,或者说采用一些搞活动,给他们打个电话,去咨询一下,通过一些方式,把这个用户去吸引过来。那这里就有一个问题,那留存到底提高到多少,我们当然期望一个用户来了就被黏住了,就像这个滚雪球一样,只要粘上去,就掉不下来了,这是理想状态,但是实际状况呢,没那么理想。

许多时候,只要有一步操作,就可能流失一部分,那到底提升多少算好,这个没有一个绝对的标准,我们基本上业内的标准就是涨到不能再涨了,并且是不同的产品形态,它这个标准也是不一样的。你比如来说对于微信这样的产品,一个月里面,有25天活跃,这就算一个不活跃的用户,但是对京东这样的产品,一个月你过来4次,这就不错,这就是一个好用户,所以你不能把这种不同的产品形态给它硬是对比,对比这个留存率,人家留存率80%多,我的怎么才5%呢,你5%说不定也是行业内最好的了,还是要同类的产品去比较,然后去看,到底多少算好。

如果留存提升不上去了,怎么办?我们还可以去利用留存,去利用它的一些规律,然后从这些规律里面去发掘这个价值,那比如来说,像Worktile这样的产品,他们其实就发现一点,就是这个周留存率比较高的这些用户,他就更容易变成一个付费的用户,那好,销售资源有限,然后就针对这些用户,专门给他们定制化的,给他约访,然后请他吃饭,或者各种方式,然后给他去做交流,然后把他们想变化去转化,这样就更加精准了。

你不是说胡子眉毛一把抓,都给大家一样的服务,那你许多都浪费掉了。那再比如我们自己的官网,这些用户到我们官网上去申请体验Demo,我们这个数据上就发现,第一天有70%的人会体验这个Demo,第二天变成百分之十几,第三天变成百分之八点几,第四天就低于5%了,后面就不怎么用了,不怎么体验了Demo,那这告诉我们什么呢?我们必须在前三天就应该联系他了,就应该跟他打交道了,如果过半个月再跟他聊,人家早就忘了,早就不记得在你上面用的怎么样,然后有什么样的问题,早就忘了。

所以你的产品,留存的规律是怎么样的呢,你要利用这种规律,这种规律怎么能帮到你,你要去利用这种用户的动作的特征,或者说你发现这个用户,一直没过来了,忽然之间又登陆了一次,十有八九这个要变成真实的用户了,你要把这种用户给他捞出来,要单独的去处理。

所以我总结一下,这里面咱做运营的事情,业内的一句行话就是先做好留存,再做拉新,就是说许多时候不要急着去做大规模的推广,怎么去吸引更多的用户,你要考虑如果你用户吸引过来都跑了,你不就是狗熊掰玉米,掰得挺多的,但是最后就留了两穗,但是如果你留存做得好,就变成滚雪球了,你是越滚越大的,你老的都被黏住,这个威力就非常大了,那另外一句话呢,就是留存的前提是激活,这是我自己总结的一句话,就是一个用户为什么更容易留下来,就是说你要先想办法变成一个激活的用户,就先让他体验到你产品的价值,只有体验到你产品价值,最终才容易留下来,这是我总结的这两句观点。

好产品要学会减功能

接下来咱们去看一个行业的案例。然后比如来这个互联网金融的,最近这几年消费金融都比较火,这一块就是说咱看都要关注什么东西,你对一个互金产品,可能要关心用户运营,每一个都是钱相关的,每一个客户你可能花一千块钱买过来的,你能不好好运营他们。

这些用户的转化,我们去通过一些渠道来的用户,他转化情况怎么样呢,来了一个新用户,我们出了一些理财产品,他整个转化过程是怎么样的呢?是不是有许多人都买了呢,这个过程跟其他第三方去进行交互,有这个资金端,资产端,之间交互的通畅度是怎么样的呢?我们是不是要去做分析,然后这些渠道,不同的渠道情况怎么样的,我们去搞了一些活动,它又是怎么样的。

我们要通过各种各样的视角,我们需要去分析,这些过程都需要用到数据,我们想办法用起来它。然后我们可以围绕一些产品,围绕用户,围绕一些标的,我们去定一些指标,去监控他们,去分析他们,比如围绕这种产品的,整体日活啊,这种PV、UV,还有产品注册率,开户率,转化率这些东西,用户这一块,投资的用户,或者说复投的这种情况,我们要去定一些指标出来,然后去整体的去监控到你这个产品。

然后我们就可以看一看怎么去优化他,比如说这是正常的一个互联网金融类的产品,用户来了之后,比如先去激活,这里的激活不是我定义的激活,而是说正常行业内一般是这么定义的,反正装了APP启动,这就叫激活了,总之他启动了。

启动之后呢,开始注册,注册之后开户,然后充值然后投资,这是一个正常的流程。那这个流程里边呢,每一步可以说用户都可能流失掉,比如说正常的一个产品,这是一个互金的产品,开始一般一个产品安装之后,他会有一个欢迎页,有些连让你跳转出去都没有,你得看完,那我这里就问大家一个问题,你说欢迎页有用吗?就是你会看欢迎页吗?你装一个APP之后。

许多时候我都是跳过去的,并且你看这个欢迎页,你翻许多都是拼凑出来的,可能就是产品经理觉得我们应该有个欢迎页,在反正上面填充点东西,就这么做上去了,但是你们要知道一点,你每多一步操作,用户都会在这一步有可能流失掉。

所以如果让我在看这个问题,那就要考虑,是不是这些欢迎页是没用的,我们是不是要做一些数据测试,去对比一下,有欢迎页跟没有欢迎页,他们之间有什么样的差异,或者欢迎页,我们是不是对有些用户,他不想看的,能够让他很快的能跳出这一步来,那我们要对他进行改进。

等到他进到这个产品之后,那你想引导他什么,你想让他更方便的登陆,还是更方便的注册,还是更方便的购买,这个环节我们都要去进行研究,那其实这就是这个当时我们分析这个问题之后,就对它进行改造。

比如来说最简单的,我们这个欢迎页,每个页都让他可以跳到注册这个页面去,不要让用户找不到,翻翻翻,翻到一定程度还找不到入口,我前一段还看了一个银行类的产品,前面欢迎页七页,中间根本就没有跳出的地方,或者有些就把那个跳出设的很小,你点点错了,就这个情况,我不知道你目的是什么,你目的难道不是为了让用户真正更快的体验到你的产品核心功能嘛,还是说你想设置一些障碍,让客户像玩挑战赛一样,非得做很多挑战,才能体验到你这个产品的价值,所以通过这些改进之后,我们就发现,这个数据从之前这个百分之九十三点几转化,到后面变成百分之九十九点几,那你这些改进其实很简单,但是它的效果,威力是很大的,你就轻松的做了一点操作,然后到后面,你就让整个用户情况,变得好很多。

另外呢,就是通过这个数据分析发现,许多用户,我们本来是想一个新用户他过来之后,点注册,然后注册之后,然后去做其他的一些操作,后来发现许多用户点到了个人中心,点了个人中心之后,他又没找到注册,又做了一些操作,这个过程呢,如果我们去看到这些数据,就发现你做一个产品经理,你就需要考虑了,这跟你设想的一样吗?这用户的操作流程,跟你想的是不是一样的,所以你要去引导,你要去改进这个产品,怎么能让一些客户按照你所设想的一些思路去改,比如来说这些新手,围绕这些新手的,我们就给他突出一点,还有前面这个Banner,就是说这上面,大家用一些APP,可能都能感受到,APP上面有几个滚动的广告图,你会看那个广告图吗?其实很多时候你是不看的,所以这里面许多时候,我们看了一些想当然的功能,做上去,但不代表它真正有用。

这个过程就是我们在做产品的时候,是要去做数据分析的,通过这些数据分析去看,到底问题出在哪里。比如来说,我们是以新手引导为目的,那我们就把新手引导这一块要做的非常突出,我自己出国的时候,我就对比,比如去美国的时候,谷歌的Uber,还有谷歌地图,这些产品跟国内的一些产品之间的差异,我发现一点,就是美国那些产品设计的时候,他追求一种极简,就是尽量让那个操作一眼就看出来,就那一个按纽,好购买,整个页面就出来一个按纽,购买,点一下就可以了,做这个操作就可以了。

而国内呢,许多东西就是做的花里胡哨,就生怕你找到那个你想干的事,这里面为什么会这样呢?其实你没有数据支撑,都是凭感觉在做的,就是你根本,这个我总结就是一个初级的产品经理就知道加功能,也不知道减功能,反正一直往上加,有客户提需求我就加上去,有客户提需求,那牛逼的产品经理,他就知道减功能,你比如说像微信,微信之前往下拉一下,是让你拍短视频的,后来发现这个东西经常许多人误操作,然后微信就干脆把那个禁掉了,你往下拉也拍不了短视频,但是现在变成显示小程序了,那又用于其他作用了。

就是说一个好的产品,那绝对不是说只加功能不减功能的,肯定还是要去研究这些东西,哪些东西对客户有用的那留下了,没用的让它靠边站,或者就把它下线掉,要做这样的操作。

那我们也可以去分析这个用户的路径操作,就是你要分析这个用户,他一步一步怎么操作的,然后那个环节是怎么样的,从全局上去跟踪他,这个我就不详细讲了。

那还有这个用户,比如来了之后,我们一个用户注册成功了之后,我们是不是想着用户,赶快去购买点东西呢,你在这个流程里面,要做对应的引导,让他做完这一步,就紧接着顺畅的到下一步去,到了下一步,比如他自己购买理财了之后,还可以再去,让他邀请一下好友,你邀请好友,我给你这个奖励,你又能去邀请好友,所以这个过程呢,你就要进行设计,设计整个过程,让他操作非常流畅,又能达到你想要的诉求,所以这里面都是需要数据分析去支撑,先看环节,哪些环节出了问题,然后去提出来一些假设的思路,然后这些思路本身还是要经过数据检验的,通过数据之后,我们看到问题出在那里。

最终,其实我们是期望回到咱们主题上,我们期望在一个业务里面,我们是希望各个决策,各个渠道,就是各个流程环节,都能去把数据引入进来,然后这个环节里面,不只是说营销端的,还有针对销售的,针对产品的,针对管理层的,我们在一个企业里面,把数据分析这件事情去做好,我们要去思考你整个流程里面有哪些环节,把自己的业务流程图画出来,把自己这种决策去画出来,我们去看那些环节,我们通过数据能帮到他,能够变得更好,这些就是你努力的方向。

总结一下今天讲的内容的话。第一点,那就是说培养数据意识,就是数据驱动的意识,我觉得用什么工具不重要,或者你掌握的数据分析的方法多少,其实都没那么重要,重要的是,你在平常的工作里面,生活里面,你知不知道用数据去证明你的观点,用数据去说话,这一点是个前提,这个特别是对一个企业创始人来说,这一点尤为重要。

如果下面的人给你费了很大劲,整理了一个报表交给你,你连看都不看,我觉得是怎么样的,我感觉咱们应该怎么做,你又拍下来了,让下面的人什么感受,下次就不整数据了,或者简单给你整一整,交给你就拉倒了,反正你又不看。所以这种数据意识再一个企业的落地,重要的还是从自上而下的,一定是从最高层,大家有这种数据意识,用数据说话的能力,然后在这种情况下,整个公司他很容易变成这样的。

第二点是要重视数据采集,我相信今天讲的内容,大家应该能感受到,就是数据采集这个太重要了,没有数据采集,你后面就是拍脑袋了,就没有一个根据。第三点就是说要借助一些数据分析的工具,通过一些工具去提升效率,而不是说每个数,你都得自己写本子,然后用一个excel,千方百计去整这些东西,花了很大代价,通过一些工具肯定是能把这个效率去提升的。

最后再给大家推荐一些书,一个是《精益创业》,其实我刚才讲产品的时候,讲到了一点,就是我们要把数据分析,引入到产品迭代里面,这个观点呢,就是《精益创业》这本书里面提出来的,它里面就是讲互联网产品怎么做的,怎么通过这种迭代这种方式去做下来的,这本书非常好,特别对于这种,之前不是互联网从业者,大家去学这一块,就能了解这些互联网产品到底大概是怎么一步步迭代出来的。

第二本就是《精益数据分析》,就是我们去针对一个产品,我们怎么去定义自己应该关心那些指标,这个呢,是这本书写的比较好。那第三本就是我自己的书《数据驱动》,我讲的东西呢,大家能感觉到,更加系统性一些,就是从数据的采集到追踪的数据可视化就一条流,而不是只是围绕某一个视角去讲。

当然如果你想更系统的去学数据分析的知识,那就需要了解一些专业技能了,这里面不管涉及到数据模型的这种,数据仓库的这种书,还是说数据挖掘的书,概率统计的,数据库的,这些都需要做一些学习,学习之后,你对整个知识面,那就非常全了,那当然对于只是做业务的,其他的剩下的这五本书那就没必要,就是它太专业,太技术了。

文:桑文锋@神策数据创始人、CEO。2007年进入百度,从在“百度知道”做研发,到开始组建并带领团队,从0到1搭建了百度用户日志大数据平台。历任软件工程师,高级软件工程师,项目经理,高级项目经理,技术经理。2015年离职百度,创办了神策数据。

相关文章推荐:

桑文锋增长实操复盘:如何使核心指标提升 7.5%
来自硅谷的指南:首席增长官如何系统性地提升用户留存?
“数据分析”究竟是怎样一种能力?企业数据科学修炼指南(2018 年版)

更多精彩,关注:增长黑客(GrowthHK.cn)

增长黑客(Growth Hacker)是依靠技术和数据来达成各种营销目标的新型团队角色。从单线思维者时常忽略的角度和高度,梳理整合产品发展的因素,实现低成本甚至零成本带来的有效增长…

本文经授权发布,不代表增长黑客立场,如若转载,请注明出处:https://www.growthhk.cn/cgo/10269.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2018-05-11 13:16
下一篇 2018-05-11 15:25

增长黑客Growthhk.cn荐读更多>>

发表回复

登录后才能评论
特别提示:登陆使用搜索/分类/最新内容推送等功能 >>