1200字范文,内容丰富有趣,写作的好帮手!
1200字范文 > LTV预估 给你的产品算算命

LTV预估 给你的产品算算命

时间:2018-09-30 01:45:48

相关推荐

LTV预估 给你的产品算算命

LTV(Life Time Value),也即用户在生命周期中贡献的商业价值,是用户增长中非常核心的一个指标项。快速准确的对LTV进行建模预估,对于产品商业能力衡量、渠道质量优劣评估、甚至产品的商业闭环能否跑通都起着关键作用。本文将主要介绍LTV建模及其场景应用。

几个基本的概念:

LTV:Life Time Value,指用户在整个生命周期中贡献的商业价值;LTV365也即用户在新增期后的365天所贡献的商业价值。

CAC:Customer Acquisition Cost,指获取一个用户所付出的成本,例如在SEM渠道获取一个激活用户所花费的费用。

ROI:Return On Investment,投资回报率,ROI=LTV/CAC。

LTV伴随着整个产品方方面面的决策,最主要应用在以下2类场景:

产品行不行:通过LTV,我们可以清晰计算出用户在产品中的活跃周期,商业价值,再与用户成本进行对比,即可辅助分析产品的商业闭环是否成立,资金周转周期快慢、盈利状况如何。

渠道好不好:通常产品都会从多个渠道去获取用户(预装、store、信息流、SEM……等等),每个渠道获取用户的成本不一样,新用户的质量更是参差不齐。因此需要对每个渠道的新增用户价值进行预估,通过ROI来评估渠道质量的好坏。

LTV预估问题定义:

LTV是用户从首次使用到离开产品,整个生命周期贡献的商业价值。图1展现了用户完整的价值累积过程示意图,用户在前7天贡献了约3元,前30天贡献了约8元,整个生命周期持续了约133天,累计商业价值约为14元,也即用户的LTV约为14元。如果我们已经知道了用户整个生命周期中各个阶段的商业价值,可通过直接统计得到用户LTV。然而很多时候,用户的生命周期持续时间很长(几个月甚至到几年),如果等用户经历了整个生命周期再来计算用户LTV,对于绝大多数商业决策是严重滞后的。因此需要对LTV进行预测,通过用户一定时间窗口(例如7天,14天)的实际数据,预估用户整个生命周期的LTV。

图1 用户LTV示意图

LTV反应的是用户商业价值,与产品的盈利模式密切相关。互联网产品主流盈利模式主要有以下几种:电商、广告、游戏、打赏,不同的盈利模式下用户LTV计算方法均各不相同。例如电商类型的产品,用户LTV主要与用户日(月)均消费额、商品毛利率、用户日(月)流失率相关;以广告收入为主的产品,用户LTV主要与用户的留存率和日均贡献广告收入相关。

首先介绍一种通用方法,对于大多数产品而言,用户在刚开始阶段贡献较多的价值,随着用户逐渐流失,商业价值越来越低,直至归零。因此用户LTV过程呈现出图1的走势,很类似幂函数(指数小于1)或者logistic函数(sigmod函数)形状。因此可以采集用户前N天实际产生的数据,通过幂函数、logistic回归、或者神经网络对LTV建模预测未来趋势,从而计算得出用户LTV。这种方式由于没有深入建模产品的收入过程,因此LTV预估准确率相对较为一般。限于篇幅,本文主要介绍广告收入类型产品的LTV预估方式。

相关定义

LT:Life Time,指一段时间时间窗口内用户的活跃天数。

ARPUDAU:活跃用户日均ARPU值,也即用户活跃一天所能带来的日均收入。

R:用户日留存率,例如次日留存率、7日留存率等,第t天留存率记为R(t)。

本文以这个示例作为阐述:某个渠道1月1日新增的用户(新增用户规模为Count),累计了14天的真实用户数据来预估其LTV值,以评估该渠道质量是否满足ROI要求。

图2LTV计算公式1

LTV是一个统计意义上的指标,指某个用户群体的均值,单独计算某一个用户的LTV值是没有意义的。因此可以按照图2的公式计算出LTV,第t天这部分用户贡献的平局收入为 Count * ARPUDAU(t) * R(t) / Count,累积整个生命周期的时间段即为用户LTV(也即公式中的西格玛求和)。

图3用户ARPUDAU示意图

图3展示了每天ARPUDAU值随时间的变化情况,可以发现用户每天的ARPUDAU值是相对稳定的,因此可以认为 ARPUDAU(t)是一个常数。在此条件下图2中的公式可以进一步推导为图4的公式,也即LTV=LT*ARPUDAU,在ARPUDAU稳定不变的情况,全生命周期的价值就等于用户的活跃天(LT)和每天价值(ARPUDAU)的乘积。到此,我们如果只需要计算ARPUDAU和留存率R(t),即可得到用户的LTV。

图4LTV计算公式2

1. ARPUDAU计算:

从图3可以看到,用户的ARPUDAU是相对稳定的,如果已经获得了用户14天真实的行为数据,对这14天的数据直接进行统计然后求平均,即可得到一个相对准确的ARPUDAU数据了。

1.1 从图3仍然可以发现ARPUDAU走势中,会有很多毛刺的现象,某些节点上下波动较大,例如恰逢双11,某几天广告收入异常偏高,与其他时间的广告收入相差很远。为了做出更准确的预测,需要进行异常点检测,过滤掉这些异常数据再求均值。常见的异常点检测算法均可使用,例如Numeric Outlier、Isolation Forest、DBSCAN聚类等算法。

1.2 如果不是全新的渠道,还可以借助该渠道之前的历史数据,进一步增强样本数据。除了已知的14天数据,还可以参考该渠道之前的3个月数据,然后对于对这3个月的ARPUDAU做时间衰减(时间越近,越能反应当前产品的商业收入现状),累积到ARPUDAU计算中,对14天得出的数据结果进行修正。

1.3 更进一步,用户的ARPUDAU还可以建模成用户消费行为、用户活跃程度、产品变现能力三个维度的函数变量,可以用一个更复杂的模型对于ARPUDAU进行预估和修正。

图5留存率变化趋势示意图

2. 留存率R(t)预估:

图5展现了这部分用户留存率变化趋势图,不难看出用户的留存率走势和幂函数形状很类似,因此可以用幂函数,结合用户前14天已知的留存率数据,对未来趋势进行拟合,得出留存率预估函数y=b*x^a。

2.1 幂函数可以较好的拟合留存率整体趋势图,尤其是趋势的头部可以拟合得非常精准,但对于趋势尾部拟合较差(幂函数尾部过高或者过低)。如图6所示,可以对目标函数进行扩展,除了幂函数之外,还可以通过指数函数簇进行拟合。根据各个渠道的历史数据,针对不同的渠道类型,选择最合适的目标函数。

2.2 幂函数y=b*x^a只会无限接近0,但是不会等于0,因此在实际建模过程中,需要选定一个阈值alpha,当留存率低于alpha时,认为用户生命周期结束。alpha的选择需要根据留存率变化的实际趋势来确定,例如1%,5%等。

图6留存率预估函数示意图

TIPS1:判断渠道质量的时候,选用多长时间窗口预估LTV更适合?

当LTV用于判断渠道质量时,很重要的一件事情是选择时间窗口,也即需要累积多长时间实际样本数据来预估LTV。如果时间窗口较长(例如3个月),LTV预估结果与真实值偏差较小,但是意味着我们对于渠道的筛选决策要延后3个月。

如果时间窗口较短(例如3天),LTV预估结果与真实值偏差较大,但是决策周期可以很短。在实际场景中,需要根据模型实际效果来确定合适的时间窗口。对于广告收入为主的产品,一般选择7~14天,ltv模型预估准确率可达到还不错的一个水平,7~14天也是产品可以接收的决策周期。

TIPS2:除了LTV预估模型的准确率之外,更重要是要构建一个完整的LTV数据服务。由于产品自身的商业能力的迭代,以及渠道的复杂和不可控性,LTV会经常发生变动,以至于模型准确率也会经常发生波动。因此需要对LTV预估结果做完整的跟踪监控,以便支持产品做更迅速准确的商业决策。

来源 | 聊技术做增长(ID:gh_ee5fed2cdb18)

作者| collin;编辑 | 鱼丸汤圆

内容仅代表作者独立观点,不代表早读课立场。如需转载,请联系原作者。collin,腾讯平台与内容事业群技术专家,腾讯看点用户增长技术总监,CCF中文信息技术专委会专委,SAAI深圳人工智能学会会员。关注微信公众号:聊技术做增长,获取更多用户增长产品技术干货。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。