1200字范文,内容丰富有趣,写作的好帮手!
1200字范文 > 【经验分享】卡方检验实战--检验次日留存率与用户分类的独立性

【经验分享】卡方检验实战--检验次日留存率与用户分类的独立性

时间:2022-05-30 16:25:47

相关推荐

【经验分享】卡方检验实战--检验次日留存率与用户分类的独立性

问题背景

最近某个游戏内测,给到一批内测用户,并且将每位用户标记为RPG游戏用户,休闲游戏用户和卡牌游戏用户中的一种。期望分别统计出这几类用户的次日留存率,并观察是否有明显的区别,用于指导后续开展游戏运营活动。

这里记录使用卡方检验技术验证用户种类与次日行为的独立性,作为备忘。

统计结果

经过数据清理和统计,得到下面的结果

P.S.:上面数据在不影响效果的基础上,进行过处理,并不代表真实的业务数据。

通过观察上面的数据,基本上可以判断不同类型游戏的次日留存率没有显著区别。但是,真的是这样吗?

卡方检验

可以通过卡方[1]检验来验证不同类别的游戏用户的流失和留存人数是否相互独立。

假设

原始假设H­0:用户次日行为与用户类别相互独立。

备选假设Ha:用户次日行为与用户类别有相关性。

PS:次日行为指次日流失或留存,用户类别为RPG,休闲或卡片类

选择显著性水平α=1%

统计

在R中,通过卡方检验,可以得到如下统计结果

卡方值:9.36, p值[4]:0.9%

结论

由于P值=0.9%,小于显著性水平α=1%,所以可以拒绝原始假设H0,接受备选假设H­a,也就是用户的类别的确影响了用户的次日留存情况,并不是相互独立的。

这里下载统计代码和数据。

参考

[1] 卡方检验wiki

[2] 卡方检验实战

[3] 《深入浅出统计学/Head First Statistics》第十四章

[4] P值wiki

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。