[思考] 浅谈群组分析(Cohort Analysis)之于产品运营的价值

yanpeng

yanpeng

作者:闫鹏(公众号:yanpeng-info),转载请注明作者及出处。

一、何为群组?

    • 8月份A渠道导入的新用户们是一个用户群。
    • 系统版本为iOS10以上的用户们是一个用户群。
    • 加入购物车却没有完成付款的用户们是一个用户群。
    • 曾有过消费行为却连续7天以上未登录的用户们是一个用户群。

……

我们可以根据分析需要划分出无数个用户群。(当然全体用户也是一个用户群)

二、使用群组我们可以做什么?

1.归因

产品数据无论是变好还是变坏,我们都应找出其原因,找出变好的原因就可以让它变得更好,找出变差的原因就可以让它停止变差。

而产品数据的关注点往往在用户身上,比如用户的活跃度、留存、付费率等。

因此数据的波动也往往是某些用户群体导致的,我们要找出这个群体,找出数据波动的原因。

那么最简单的方法就是分组看数据(group by),举个简单的例子:

用户流失率升高了,怎么归因?

首先要知道我们的用户在不同维度下都可以分成多组:性别维度分男女,年龄维度分老少……

而各组用户的数据趋势往往是不同的,也就是说数据的变化是非均匀分布的。

浅谈群组分析(Cohort Analysis)之于产品运营的价值 - 非常6游戏团队(66team) - 1浅谈群组分析(Cohort Analysis)之于产品运营的价值 - 非常6游戏团队(66team) - 2

那么,如果我们以用户来源作为维度来分组看数据,我们就可以知道是不是某些渠道的用户出了问题。除此之外,我们还可以以产品版本为维度、以用户的操作系统为维度、以用户的网络环境为维度、以用户的对产品的使用进度为维度、以用户具体行为为维度(如通过是否触发(或完成)过某行为将用户分为两组;也可以用多个行为将用户分为多组)……

回到例子中(以游戏产品举例,其他产品同理):

  • 我们先以渠道作为维度,发现各渠道趋势相似,无明显差异。那么,我们就更换维度。
  • 这次,我们以产品使用进度为维度,发现只有等级为5的用户流失率随时间的推移上升明显;浅谈群组分析(Cohort Analysis)之于产品运营的价值 - 非常6游戏团队(66team) - 3
  • 我们再以用户行为为维度,发现完不成5级的主线任务是5级流失率上升的主要原因;浅谈群组分析(Cohort Analysis)之于产品运营的价值 - 非常6游戏团队(66team) - 4
  • 再以行为为维度,发现没有获得道具X是未完成5级主线任务的主要原因;
  • 再以行为为维度,发现没有去地图N是未获得道具X的主要原因;
  • ……(如此一步步归因到最后)

最终,我们发现是产品的引导做得不够明晰,用户不知道要去地图N才能获得道具X。

可以看到,通过这样分组观察数据,我们可以较容易地找到数据变化的原因所在。

另外,再次提醒:在整体数据趋于稳定的情况下不应大意,此时有可能是一部分用户群的数据正在变好,另一部分用户群的数据正在变差。

2.精准观测目标用户

我们做产品是有目标人群的,我们做功能优化、活动策划往往也是有目标用户的。我们要明确地知道目标用户是谁,他们之前和之后的数据是怎样的,才能评估产品改版或活动执行的效果,而如果我们仅通过观测整体数据来衡量,则效果往往不明显,因为数据会被冲淡和干扰。

3.精细化运营

不同用户群的需求往往是有差异的,因此一视同仁不如各给所需。

还有一类特殊的用户群体,我们称之为高价值用户,二八定律大家都知道,显然我们应该找出这20%的人,并重点服务好他们。

4.对比分析

很多时候,我们看单一群体的数据是不容易发现问题的。

  • 比如,我告诉你某APP第二季度男性用户贡献收入1000万元,你觉得是多还是少?你可能会觉得条件不足,无法判断。
  • 如果我再告诉你它同比增长15%,环比增长10%呢?通过对比不同时段的群体,你可能会觉得它的増势还不错。
  • 如果我再告诉你其女性用户贡献收入3000万元,同比增长60%,环比增长30%呢?通过对比不同性别的群体,你会了解到这两个群体的差距越拉越大。

这就是数据对比显而易见的意义。

在其背后我们可以考虑两个群体差距拉大的原因是什么?是否符合产品预期与定位?未来是期望继续拉大差距(专精)还是缩小差距(平衡)?

我们最常用也是最简单的用户群对比就是“同期群对比”,包括同比和环比。

“同期群”简单来说就是以时间起点为唯一变量(时间长度相同,其他条件也相同)的多个用户群。

用中秋假期(3天)的用户活跃数据对比端午假期(3天)的用户活跃数据,就是简单的同期群对比。

比“同期群对比”高级一点的是“同期群分析”,区别在于前者对比的是“点”数据,后者对比的是“线”数据。也就是说“同期群分析”会对比多个同期群随着时间而发生的数据变化。

最常用的同期群分析就是留存分析,比如8.20、8.21、8.22三天的新增用户构成了3个同期群,查看并对比他们在各自随后七天的留存率变化就是一个简单的同期群分析。我在3年前写的一篇关于LTV分析的文章用的也是同期群分析的方法。

浅谈群组分析(Cohort Analysis)之于产品运营的价值 - 非常6游戏团队(66team) - 5

浅谈群组分析(Cohort Analysis)之于产品运营的价值 - 非常6游戏团队(66team) - 6

同期群分析的主要目的在于通过对比来发现出现问题的“群”,通过优化产品,我们期望“新群”的数据能够总是好于“老群”。

同期群的分析只是群组分析的一个典型案例,除了时间,我们还有很多划分群组的维度,也可多维度组合,如一线城市的互联网从业者对比二线城市的互联网从业者。

在BI系统的所有数据展示区域,我们都可以加上用户群对比的功能,以查看并分析不同用户群体在不同数据指标上的表现差异。

5.群画像分析

将用户群体的属性分布逐一展示出来,就是群体画像。

通过群画像,我们可以了解到指定用户群的年龄分布、性别分布、等级分布、设备品牌分布、活跃度分布等等。

通过观察和对比群体画像,我们可以了解到自己对目标用户群体的定位是否精准,以及该往哪个方向调整。

 

三、系统实现

没有成熟的系统支持,群组分析的门槛和成本其实还是有些高的,需要手动取数和作图,而这部分工作其实是可以交给程序来完成的。

那么,系统实现的难点就在于如何帮助使用者简单地拼装sql语句进行数据的提取,以及如何做好数据的可视化。

具体实现方法我之后会单起一篇文章简单谈一谈。

闫鹏,2016.9.8,微信(QQ):11345191博客:www.yanpeng.info

Leave a comment

发表评论

邮箱地址不会被公开。 必填项已用*标注

Comments