【磊叔批注】神策数据:解读千人千面,洞悉数据智能的价值
2024-11-10 17:42
本文根据神策数据业务咨询师潘书荟《数据智能打造“百人百态 & 千人千面”》的主题演讲整理,从判断企业是否需要千人千面、如何实现千人千面以及效果追踪三大方面展开。(完整 PPT 下载地址请阅读原文)“千人千面”很容易理解,即找到对的人,用对的形式送达对的信息。目前,几乎所有的互联网头部产品都做了“千人千面”的规则推荐,以至于我们有时候看到自己不喜欢的内容时,反而会去怀疑自己是否真的不喜欢、是否有还未挖掘的兴趣偏好等。在这样的市场环境中,是否要随波逐流,全部“拿来”呢?我认为,企业首先需要考虑“千人千面”能够给自己带来的价值,核心在于以下两点:如果使用人工策略或不使用任何策略,用户也能看到自己喜欢的内容,但搜索成本较高且需要用户承担;通过机器学习等智能策略,可以降低用户的搜索成本,实现内容到用户的分发效率提升。磊叔批注
分发效率这件事非常重要。产品的体量起来之后,产品上的流量位置和区域就是产品商业化能力的命脉。但由于互联网产品的局限性,优质的流量位就那么几个,各个业务必然会为了争抢流量打的头破血流。事实上,在实际工作中几个业务部门为争抢金刚位会吵的不可开交。
所以需要千人千面在最前端将用户分流,并根据用户的特征和标签将用户分流到不同的产品架构。
部分企业常用手工方式跑运营闭环,从活动策划到执行,到监测,再到复盘,如果在此过程中采用数据智能,那么提升的不仅仅是工作效率,更对效果有正向驱动力。也就是说,企业需要将更多的时间花在策略调优上,而不是执行落地的过程。磊叔批注
也就是结果导向,关注结果,而非过程。
结果导向关注的是如何应用更有效的策略,而非纠结“100-10”还是“100-5”的优惠券。
类比数据分析就好理解一些:关注数据分析的结果和结论,而非分析的执行过程。
结果导向关注的是“DAU下降10%应该怎么做”,而非“如何用Python分析DAU”。
也就是说,如果以上这两点的提升能够帮助业务增长,那就代表着企业可以着手去做了。场景一:计划营销,通常表现为单次性、周期性运营策略。举个例子,电商企业在大促的前 7 天或者前 1 天,企业对用户的一次性信息推送就属于单次性计划营销;每个月的工资日、还款日的消息提醒需要重复、有规律地执行,这种就是周期性的营销。当用户到达产品环境,企业可以有效利用分层推荐实现效果提升。常见的形式有:开机图、Banner 图和轮播图,这三种推荐的物品量级往往较少,且更新迭代速度较快,除此之外,在设计这三种推荐规则时基本上已经明确了目标受众。在这个场景中,采用人工决策基本上可以实现分层运营的目标。磊叔批注
除了开机图、Banner 图和轮播图,还有金刚位,以及页面营销栏位等。上上篇内容对分层推荐有清晰阐述,请参详:
《【磊叔批注】为什么大厂改版都在做用户分层设计?》
在此阶段,我们梳理出触点营销和精细化分层推荐两个场景。(1)触点营销通常是指通过人工决定策略方向,机器辅助计算决定触发时机。比如,当用户多次浏览产品但没有实现转化时,可以通过机器设置:在用户浏览产品 30 分钟后无购买行为的情况下及时触发优惠券推送等策略,提升用户转化效率。磊叔批注
触点,是指能够直接触达用户,或用户能够直接与产品/营销活动产生联系的营销形式。
常见的触点包括产品触点和营销触点:
- 产品触点:push、sms、tel、图标动效 / 红点 / 角标。
- 营销触点:即下文各类营销规则,如红色下划线所示。
再比如,对于新客来说,我们希望一步一步加深其对产品价值的体验,往往会在新客进入的第 1 天、第 7 天、第 30 天的时候进行用户触达,如果单纯依靠人工拉名单完成推送,耗时耗力,而通过机器实现对新客的行为追踪,就可以轻松实现特定日期的自动化推送。(2)精细化分层是在产品内部,针对用户的个性化行为进行精细化推荐的过程。举个例子,银行业的功能推荐菜单,一般包含 100 个以上的功能,当用户进入产品后很难第一时间判定哪个功能是该用户真正需要的,这个时候就需要企业针对这 100+ 个功能进行梳理,每个/每类功能适合哪些用户,然后基于用户过去一段时间的访问频率路径对功能展示进行排序,也就是说人工 + 智能共同实现精细化推荐。磊叔批注
这里的精细化分层工作非常具有挑战性,例如:
1)如何将100+种服务 / 功能合理的放到 10 个金刚位上?
2)金刚位 A-B-C-D-E和金刚位A-B-C-E-D是否有必要分为两个客群?
3)100+个服务,分层不合理或许会产生多达1000+个客群,我们叫分群爆炸。和维度爆炸类似,必须严格避免。
提及“千人千面”,大家第一时间想得到的多数是全流程智能,也可以按照当下流行的机器算法、深度学习概念去理解。其应用场景如下:第一,智能营销,即基于算法程序实现的自动化、个性化营销,依靠机器识别并触发的营销推送,目前该场景还未广泛应用。磊叔批注
未广泛应用的原因在于:
- 营销端难以通过机器算法自动识别,并自动匹配或生产营销策略。
- 营销端策略的容错性非常低,对营销策略的精准性要求非常高。
第二,智能推荐,基于算法模型实现的个性化推荐,多用于信息流、相关推荐、热门推荐等。磊叔批注
这个就非常成熟了,不多赘述。
磊叔当年就是做短视频信息流的推荐策略,多年前各类推荐算法、场景、特征工程就已非常成熟。
企业落地“千人千面”的核心是 ROI,在此原则之下还有一些硬性条件:(1)用户量级和物品量级。在神策智能推荐产品化的解决方案中,我们对于客户拥有的物品库有一定数量要求,低于 5000 的物品量级或者日活没有达到特定级别时,是不适合做算法推荐的。(2)用户标签和物品标签的建设程度。在企业面向用户进行精细化运营时,如果没有足够数据支撑用户分层和识别物品特征,那么精细化运营的工作将难以开展。(3)实时行为数据流。无论哪一个阶段的数据智能应用,都依赖对数据的实时收集,然后才有可能基于用户的浏览行为实现个性化推送。在以上三点都满足的情况下,企业可以基于其现阶段的 ROI 决定场景及优先级。对于算法实现的“千人千面”来说,它的流程一般从数据系统开始,采集用户行为数据并灌输至算法推荐系统,经过一系列的处理,推荐最合适的结果,然后再将结果返回用户前端做展示,同时监测用户点击效果,以此判断本次推荐效果的质量,持续优化,形成算法推荐的完整闭环。如下图所示:在以上闭环中,模型训练对于业务人员来讲是一个黑盒,它主要分为三个步骤:1.物品召回,针对用户个性化展示适合其看到的物品。2.排序,基于各种各样的判断条件对挑选出的物品进行排序,以确保其能够产生较好的曝光和转化效果。3.重排序,该阶段需要较多业务输入。举个例子,运营人员对于产品调性和多样性有一定的要求,比如某个用户更倾向于看与宠物相关的短视频,但很难有一个产品能够只播放宠物类视频,这就需要企业清楚认识到对长期用户行为的判断是否应该完全依赖于算法产出的短期效果。磊叔批注
这里的“召回-排序-重排”即是现代推荐系统的标准架构,其中运行着很多种推荐策略,我们叫做“拉链,chain”:
- 召回层:负责从原始内容池中根据用户特征拉回数据,量级一般在几万~几十万,常见有热点召回、多目标召回等算法。
- 排序层:在召回层的基础上按照业务目标进行筛选(例如会做ctr预估),量级一般在100~10000个,也叫粗排层。
- 重排层:在排序层的基础上按照推荐场景下发给用户最终的推荐结果,一般包括槽位策略、冷启动策略、混排策略、打散策略等,量级一般在5~15个,也叫精排层。
而想用好算法推荐,需要基于算法的数据智能依赖于技术与业务的双重护航:其次,算法模型本身。神策的算法功能,比有些客户之前用的自荐或其他模型写出的推荐效果更好,我们甚至没有进行深度调优,这就充分体现了算法模型本身的优越性。算法并不能帮助我们解决所有问题,其典型代表场景是冷启动。针对此,我提出两点建议:①从新用户进入产品前的渠道做信息和内容的承接,确保用户进入产品后,可以看到符合他预期和需求的内容;②设计好的策略主动向用户收集信息。磊叔批注
说白了就是想尽办法在用户看到真正的内容前收集用户的特征,以解决新客首触 / 落地的留存问题,常通过兴趣预选、CF等来帮忙。
很多时候,算法并不依赖于用户标签和物品标签的建设,所以有的业务人员会忽略对标签建设的重视;但算法解决推荐问题的效果需要通过数据分析来做判断,本质上是对一个指标进行层层拆解的过程,如果用户画像标签/物品标签建设不完善,就会对推荐效率和质量的判断产生一定的影响。因此,虽然算法可以帮助我们解决很多问题,但同样要求我们重视本身数据的建设。磊叔批注
所以标签非常重要,通常考察标签系统 / 模型的指标是:准确率、覆盖率和召回率,简称准召覆。业内平均值大致为:
- 准确率:85%
- 覆盖率:80%
- 召回率:100%
其中覆盖率无法达到100%,原因请见:
《【7000字】为什么我说你并不懂标签体系》
对于人工干预来说,它涉及到的通常是一些特定环节,比如,对于特定物品的封禁行为,参数调整,重排序阶段的策略等。通过以上,我们可以了解到算法本质上要结合业务去实现,且有一定的门槛,具体表现在业务、技术和人三方面:1.业务模式是否适合用算法解决“千人千面”的问题。首先,算法的最大价值在于内容到用户的分发效率,那么企业的商业模式下对内容到用户的分发效率是否重视,影响力如何等。然后,在业务发展的阶段,我们势必会优先建设内容以及拉新的动作,那么此时是否需要投入大量精力去做算法的系统,实现“千人千面”呢?2.是否有足够的技术资源和大数据基础支撑企业做好算法、或通过其他形式实现“千人千面”。在人工与机器智能落地方面,它的本质很好理解。首先,我们会基于特定的条件去挑选出满足条件的用户,往上可以跟一些通道系统、营销系统做对接,名单就会被自动推送,我们接下来要做的是发短信、推 push、发优惠券、发红包等一系列动作,这个是针对我们圈选的人群做的一些针对性运营设计;往下走可以对接内容营销,配置展示的内容以及顺序,通过人工决策指明方向,然后再由机器自动化去实现。如何组建整体运营系统?我们可以从点、线、面三个层面对运营动作进行梳理:点,断点营销。梳理业务流程中用户流失原因,并针对性地做一些挽回措施。比如用户访问理财详情页但并没有在指定的时间内完成转化,或者因为某些原因造成登录失败进而导致用户流失……梳理完用户行为流程之后,针对各个环节的流失风险针对性制定策略。针对访问未购买的用户,推送 push 为其推荐更加合适的理财产品;针对提交订单未支付的用户,站内 push 配合短信触达,发送优惠券等促成用户转化。磊叔批注
断点营销,通常根据在业务流程中的脱落 / 流失状态来制定和出发营销策略,常包括实时策略和非实时策略。
- 实时策略:需要营销系统能够提供分钟级响应,常用于极其重要的业务挽留;
- 非实时营销:一般在 T+0 内挽留。
线,流程推进。面向特定功能、特定业务、特定活动去做的持续性推广,设计一些流程性的任务,比如在进行优惠券推送时,如果 5 元优惠券带来的转化效果并不好,那么改为推送 10 元的优惠券,根据效果层层递进,试探性地触达,所以该方法适合针对特定用户达成的目标需要做持续运营的场景。面,分层运营。通过对所有用户进行分层,规划每一个分层适合的运营方式,以此实现千人千面。业务人员通常不知道该如何着手设计运营计划,我们建议可以通过一个比较通用的模型,诊断产品现存问题,然后针对问题环节设计优先级较高的运营策略。举个例子,基于客户生命周期模型,在“拉新效果较好但转化不尽人意”的情况下,我们需要从新用户旅程中筛选出重点环节,制定拉新、激活转化、复购、流失召回等全流程的自动化运营策略;同时,也可以明确在激活环节的运营策略是否对转化提升有所帮助,洞悉运营质量与效果,提升运营效率。首先要对产品内的运营位进行梳理,在制定策略的时候重点体现用户分层运营,比如面向新老用户分别设置功能菜单运营计划、产品推荐计划等。在推荐计划设置和运营的过程中,可以结合用户标签体系,面向特定人群做差异化内容展示,实现千人千面。综合来说,千人千面是一件有门槛的事情,具体在建设过程中需要注意以下问题:- 数据流和业务流的融合程度,它直接决定了我们制定策略以后,机器的执行效率和质量;
-