用户增加三驾马车:模型、策略以及话术。这三者是一个有机的整体,需要协同发挥最大的业务效果,本篇主要讲一下作者对模型的一些认识。
因作者不是专门模型同学,在这一块不敢班门弄斧,但是可以从业务效果的视角来看模型如何和业务配合,达成客户预期。
一、模型的必要性
这基本上是一个毋庸置疑的问题,但是也不绝对。还是和场景和用户量有关。
笔者在做某业务时,之前由于样本问题,笔者发现的模型的人群有所偏移。在这个时候,就算减少人群包的投放数量,尽可能地选取高分段投放,也发现成本有点失控,其实这个时候是作为业务基础的模型出了问题,最终导致成本的不可控。所以,模型是业务的基本盘,没有模型,相当于盲投,会对业务产生直接影响。所以,笔者的意思是模型是业务的基石,必不可少。模型出现问题,直接影响业务的开展。必须将模型调整好,才能保证业务的正常进行。
但是在下面两个情况下,没有模型也可以开展业务:
1、公司有大量的有效标签,且标签的覆盖度和准确率非常高,这时候用这些标签筛选出来的人群,相对于来说画像很明确,对业务效果的可解释性也很高。笔者接触到的公司很少有这个数据基础,其实就算有这个数据基础,基于这个筛选条件挑选出来的人群毕竟有限。毕竟业务本身不光是要成本考虑,更多是业务规模考虑,这时候可以前筛策略人群结合模型一起为业务服务。
2、在一些场景中,发现模型的排序性对成本的影响很小,按照模型从高往低取到很低,都能在成本范围之内。那这时候,可以模型0分以上都进行投放测试,甚至可以取模型覆盖不到的人群进行投放实验。
二、模型优化方法
这一块笔者不谈具体的模型优化算法,主要谈样本的质量和数量。模型效果的好坏基本取决于公司的数据基础以及相关场景的样本。不同的算法确实模型效果会有差异,但是失去有效的样本,就是无根之木了。
样本的质量和数量和样本的比例有关,这部分很少会遇到问题。关键的问题在于如何定义正负样本。在不同的场景中,正负样本的定义决定了样本的质量,从而根本上影响模型的效果。
以下面场景为例,作者仅作为举例,定义了一些场景的正负样本,主要涉及正负样本的定义、比例、量级、包含的标签以及模型的预测核心目标以及优化目标:
信贷场景拉新:
- 正样本:注册、完件或者授信,其中注册和完件为必填项;
- 负样本:未注册;
- 标签:是否注册、是否完件、是否授信、营销日期(注册前最后一次营销);
- 比例:正负样本比例1:1~1:10之间;
- 数量:注册正样本至少10万,完件正样本至少5万,授信正样本至少3万;
- 算法选择:分类模型或者排序模型;
- 预测核心目标:注册;
- 优化目标:注册-完件率,完件-授信率;
保险场景建模:
正样本:购买成功;
负样本:未购买;
标签:营销日期、是否购买;
比例:正负样本比例1:1~1:10之间;
数量:正样本至少10万;
算法选择:分类模型;
预测核心目标:购买成功;
优化目标:营销-购买成功率;
三、模型和策略以及话术的配合
模型和策略的配合
笔者在实操中发现,同一模型采用何种策略和以下几个有关:
1、目标客群分析:根据转化人群,如果发现年龄、地域之间有很大的差异,就需 要分开取数;一般来说,运营商之间的差异较大;
2、自有数据体系:例如我们推测在某一部分机型上UV异常,如果有数据覆盖度 和准确率够,也可以做一个对比测试:即同一批客群,排除这部分机型和包含这部分
机型做对比,看对成本有何影响;在信贷场景,也可以在模型上叠加一些多头指标,
看区分度如何。
策略本身只是最大程度发挥模型的区分度。如果不区分策略,统一提取高分段
人群, 由于各个细分客群的转化效果在每个分数段的表现不一,在业务中的表现就是
分数不能下沉,或者效果不稳定。其实其根本原因还是对模型没有充分的利用。
模型和话术的配合
和笔者在前面讲到,模型是一个基本盘,策略和话术是使得模型能发挥最大的作
用。在模型和策略明确之后,那各个人群包的画像也相对固定。但是话术优化会有一定的周期和成本,所以需要根据业务规模看是否需要对话术做专门优化。
例如年轻人群是否需要专门的话术优化?如果某些大省占比总投放量很大,是不是
话术的说法以及关键词匹配要做专门的适配。
模型是把人群的兴趣度做了高低的排序,那话术的作用就是最大程度的转化人群对
产品的兴趣。所以对于不同地区和不同年龄段人群的说法,如果有相应的话术配合,可
以起到相形益彰的作用。
对于模型本篇就讲到这里,笔者不是专门模型人员,通过和模型同学的聊天以及咖啡时间的讨论,撰写此文希望对从业人群有所帮助。
本文经授权发布,不代表增长黑客立场,如若转载,请注明出处:https://www.growthhk.cn/cgo/user/49907.html