在前不久的一次线下的交流活动中,我给现场学员出了几道有关数据驱动和用户画像的题目,结果很有意思,我分享一下几个典型的题目和答案统计如下:
问题1:想要用户增长你会怎么做?
几乎90%的学员都选择了要了解现有用户分层结构。
问题2: 实现千人千面产品最需要的企业能力?
从回答的结果来看:90%以上的学员选择了数据采集,近80%的学员选择了算法建模。
问题3: Profile形成的用户画像可以用在什么领域
从回答的情况来看,近95%的人选择了精准营销,近89%的人选择了个性化服务。其他问题限于今天的篇幅,下次举例给大家。
所以今天的关键词就是用户分层、精准营销和个性化服务,似乎很多企业都在希望可以通过大数据和机器学习技术来实现技术驱动精细化运营,降本增效,但为什么效果都不好呢?
要成为可以实现数据驱动精细化运营的黑客,你的团队需要做好这些事情:
企业的数据驱动运营的基础:数据采集和整合
举一个比较具有代表性的例子:
- 某在线旅游企业的主要业务是目的地度假、机票及门票线上销售业务
- 该集团有大量线下营业的门店,店内也有销售终端负责线下订单管理。
- 该企业有“XYZ游”这个产品,主要以“XY游”APP+H5站提供服务,分“安卓”及“IOS”两个版本,可从应用市场下载,使用友盟分析工具
- 该企业后台收集了部分注册信息和订单数据,与友盟数据有差异。用户为中、高端的自由行的客人,提供目的地度假服务,包含行前、行中、行后服务。
- 该集团管理层希望对对潜在用户(关注未注册)、实际用户(已注册)、休眠用户做360度的全貌了解、分析;对每次在APP中或搜索引擎广告、微博、微信等新媒体中做的活动,做实时的了解及评估,制定有效的业务增长方案。
- 更进一步,由于人工智能很火,该集团希望通过引入大数据和人工智能降低人工运营成本,并实现的数据驱动的自动化运营效果。
我相信这个集团是希望能够像我们在集训营中教授那样可以通过对数据的利用,从人工规则过渡到通过输入有效数据,来训练系统建立决策模型,达到部分甚至全部自动化的阶段。
所以好像下面这样的解决方案可以满足他们理想中的“数据和AI驱动运营”了吧?
这看上去似乎是一幅很美妙的前景,不是吗?
如果你深入分析上面这家企业,其实整个团队连数据收集和整合处理的基础工作都没有做好,我列举一下可能的情况:
- 该企业没有一套完整的数据仓库,把外部和内部的数据保存完整(Raw Data,非采样数据)
- 该企业的用户行为数据没有设计规划过数据采集策略,比如对“新增”,“活跃”,“崩溃”,“会话”,“事件”等数据基础指标的定义不准确,数据上报的频率,场景,类型没有规划。
- 各业务平台:各个网站(官网&移动网站),不同版本的APP用了完全不同的技术供应商,数据完全缺乏可信度。
- 各个外部渠道的数据追踪不准确,包含:广告渠道(比如:SEM搜索广告、百度品专、付费应用市场)、免费渠道(比如:organic搜索、免费应用市场)、直接流量、合作渠道等
- 后台的订单和注册数据缺乏与行为数据关联整合的手段
- 所有的运营及营销效果数据靠人工跑数据,并经常出现字段意义混淆,或者干脆没有相关数据
下图是一个大型电商企业的数据埋点混乱的示例
试问,在这种情况下,不要说在各个网站和APP对每个用户做到千人千面了,哪怕是最基本的数据分析和挖掘都可能无法实现,还谈什么人工智能驱动业务运营呢?
俗话说,工欲善其事,必先利其器。
拿饿了么的例子来说,一套智能化的千人千面产品背后必然有着坚实的平台和工具体系,饿了么的搜索推荐体系包含横向的基础设施层、数据及特征层、算法及模型层以及纵向的策略支撑平台和业务运营平台。
基础设施层可谓是最底层的设施,包括大数据处理平台、机器学习平台、实时计算平台,用来提供最基础的数据处理能力和机器学习能力。
数据和特征层包括为搜索推荐广告等业务构建的私有数据仓库和主题集市、实时生态数据体系、文本和标签挖掘体系、用户和商户画像体系以及特征处理中心等。
策略支撑平台包括模型管理系统、AB测试引擎、实时效果监控及Debug系统等,主要是为了提升整个算法流程的效率,快速进行迭代。以AB测试引擎为例,搜索推荐的各个服务均已接入,每天运行的千人千面的算法测试有几十个以上。
业务运营平台主要是供产品、运营人员查看和调整算法层面内容的平台,包括流量调控系统、排名可解释系统、词库和标签管理系统等。
一个典型的数据驱动业务增长的例子(含AB测试)
下图是一个旅游平台酒店的用户画像案例。通过把用户与业务属性相关的数据进行线性回归计算,然后把结果偏好映射到了二维表。二维表的数值越高,代表用户的消费能力越高,最后可以基于这个映射过程做“同类人推荐”。
在大型的旅游平台里,用户经常会浏览酒店下方的评论,这些评论可以通过文本挖掘的方式形成标签,例如“价格适中”、“安静”、“床品好”等描述词,然后再通过自然语言处理算法形成数据模型,并内置在系统中给每个点评打出用户标签,这样的做法可以影响到新用户的转化率。
当一个新用户在浏览过程中,系统可以根据这个用户的标签,筛选到类似的点评首先展现在页面上,会对转化率有一个很大的提升。
▍通过AB测试验证相关性
在上面讲讲到的酒店案例中,在一开始上算法的过程中,其实是不能保证一定可以有效提升转化率的,因此要做AB测试。
A/B测试是现代科学方法特别是西医的基础,可以用于企业的科学决策,保证业务的确定性持续性的增长。A/B测试已经逐渐替代传统的“拍脑袋”决策方法,在互联网行业有广泛的应用。
实际上一些很有名的例子,一些很有名的增长公司都是这么做的,比如说 Aribnb,他们所有的页面修改和流程上的调优,都会通过灰度发布到1%,或者5%的用户,去看访问时间,去看留存,去看下单,只有好的它才会上线,坏的它就会砍掉。
Google 每个月都会做几百个测试,其实有一些给 Google 带来了很多的营收增长,也有很多是很失败的项目。Google 在几百个里面,可能最后有10几个成功了,这些产品经理他们可能很骄傲,自己的产品能够给全世界所有的用户用,还为公司带来了2%营收的增长,仅仅通过 AB 测试的方式 Google 就可以达到华尔街的要求。
有一些东西真的只有测试过才知道,就是产品经理、运营人员、技术人员,没有办法理解的,比如说 Google 的广告位,如果你左移一个像素你就会赚钱,左移两个像素你就会亏钱,没有任何人知道为什么,但是 AB 测试可以告诉你。所有的改动都需要提前经过测试之后才可以上线。
Facebook 更是这样,他们的移动端尤其如此,会把所有的新功能都集成到代码里面去,然后再把未来6个月要做的试验都集成进去,不断地去测。除了 Facebook 的产品得到提升之外,它还得到一个特别好的口碑叫没有 bug,可以想象 Facebook 几十亿的下载,它没有 bug 是多么的可怕。国内的百度搜索、大众点评、知乎这些网站,他们也都会做自己的 AB 测试,当然他们做的也都很好。
上图是谷歌的一个工作流程,在任何项目实现之前,都需要先做一个小流量的测试。AB测试是利用统计学原理,把一个产品上的用户,按照流量的算法进行区分,排除相互干扰的因素进行测试。通常会进行三组,一组是原来的版本,第二组是测试的试验组,第三组是一个对照组(与试验组不同的方法,用于排除某一个特定的元素)。
在做AB测试的时候也需要根据用户标签做筛选,根据特定用户群体做验证。关于AB测试的70%的结果,很可能是让你意识到你的实验结果没有统计性上的显著相关性。也就是前面的相关性表格,如果相关性不显著,可能这个方案就要放弃。我这里再强调一下相关性因果性的事情,大家可以看下面这个例子:
如果说一个外星人来到地球,发现下雨的时候经常出现雨伞,所以他判断“因为有雨伞,所以下雨了”,这个是有问题的。雨伞和雨是相关性的典型例子,用因果来判断会导致以为不带伞就不会下雨的谬论。因果其实也是我们人类在探索产品改版,或者遇到未知问题时候的一种思维模式,我们希望通过A来验证B是否产生,来判断A导致B,而往往陷阱就在这个思维模式里面。
希望大家如果在实战当中要用到 AB 测试,可以看微软的科学家Ronny Kohavi 总结的八条经验,非常非常黑客的经验:
- 经验一. 效果惊人,某些很微小的改动,就可能造成对你 KPI 巨大的影响。
- 经验二. 大多数改动都不会大幅度提升 KPI,所以你需要耐心。
- 经验三. Twyman 法则,凡是看上去很出人意料的图表,通常都是因为数据统计错了。
- 经验四. 各个产品几乎都不一样,你复制他人的经验,往往都没有什么效果。
- 经验五. 任何能加速用户响应时间的改动,都会带来 KPI 的正向提升。
- 经验六. 点击率是很容易提高的,但是流失率是很难改进的,千万不要把精力放在优化某个页面点击率上。(其实要提高点击率非常简单,你只要在这个页面上加一个大美女就可以了,但是它并不能带来你真正实际上的增长。)
- 经验七. 尽量不要做很复杂的大量改动的实验,而是要做很简单的小的迭代。
- 经验八. 几千上万的用户才容易展开高效的 AB测试。
文:顾青 @共相Ebizcamp(e-bizcamp)
首席增长官CGO荐读小红书推广:
更多精彩,关注:增长黑客(GrowthHK.cn)
增长黑客(Growth Hacker)是依靠技术和数据来达成各种营销目标的新型团队角色。从单线思维者时常忽略的角度和高度,梳理整合产品发展的因素,实现低成本甚至零成本带来的有效增长…
本文经授权发布,不代表增长黑客立场,如若转载,请注明出处:https://www.growthhk.cn/cgo/19026.html