许久都没冒泡了。。。这次写一个我想了很久才搞明白的问题
国内相关文章并不多,涉及的工具、概念也算比较新,所以在这里写一下,希望帮到有同样困惑的人
一般小团队存在的问题
目前,我发现了一套解决方案,能基本满足小团队早期的数据需求,以下以我自己的网站为例进行介绍
地址:http://learnbyreading.herokuapp.com/
我这个网站是个爬虫站,定期自动爬取 Amazon 的书籍数据,并做简单的统计分析,呈现出近期的好书,方便我找书看
那么,对这个产品,我有哪些数据上的需求、问题呢?
(1) Metabase
用 Metabase 连接网站的数据库,就可以直接做分析,上图是我做出来的 dashboard, 包括了当前书的数量、评分的分布等等
具体使用也很简单,用的 query builder 就行
(2) Google Analytics
这个大部分人都很熟,在网站/App 里嵌套好就行,可看网站的访问量、流量来源、地区分布等等
不过仅仅这样的话,也不需要什么解决方案了
因为。。。。。其实还有新的数据分析的需求
(3) Mixpanel
随着对数据分析学习的深入,我知道了可以做更多的分析来分析产品的好坏
比如说,我这个产品的目的,是帮助用户们找到更多的好书
所以核心的指标,其实是“用户点开了书”
用户访问的书越多,说明帮他们找到潜在感兴趣的书也越多。如果满屏都是不感兴趣的书,用户是不会点的,也说明我的产品没有达到目的。另外,网站还能显示书评的详细内容,我也想知道有多少用户查看了
这个时候,就要用到埋点(tracking)了
开发好后(i.e. 把大象放到冰箱之后),就能看到用户访问了某本书,是否查看了 review 的事件,这个是通过 Mixpanel 做到的
也能看到每天各个事件的统计量,我也能知道用户查看的书最多是什么,使用哪类跳转最多
此外,网站一个核心的指标,就是查看页面 -> 查看书籍的转化率,用漏斗分析可以做
可以看到转化率还是挺低的
不过,如果你对 GA 熟悉,会知道 GA 也是能埋点的,那为什么要用 Mixpanel, 而不用 GA 呢?
因为 GA 对于分析的支持并不够,像上述的漏斗、事件分析,GA 做起来是很困难的,而 Mixpanel 简单操作就行了,类似的还有多重事件定义、用户人群的分析。也就是说
需要注意的是,Mixpanel 目前的 UX 比较差,功能有很多,但没讲明白到底干嘛的。简单来说,包含了 2 大块
(4) Segment
除了 GA,Mixpanel, 可能你还要用到其他的外部工具(比如 Amplitude),这时就有个头疼的问题了,因为这些代码都很相似,但是都需要反复开发、调试
这时,就可以用到 Segment
Segment 对埋点类工具做了抽象,也就是说,只开发 Segment 的代码一次,然后再通过配置就能开启 GA, Mixpanel 以及其他的工具,适配的工作交给 Segment 来做就行了
我这里就是 Google Analytics + Mixpanel + Amplitude 同时开启了的,方便对比产品功能
更重要的是两点
可以简单的把 Segment 理解成 Stripe for Analytics. 类似于电商做支付的时候需要对接很多平台,而 Stripe 把这些都做好了,我们调用就行
至于能用的其他的工具有哪些?可以看 Segment 自己的介绍
https://segment.com/academy/intro/navigating-the-sea-of-customer-data-tools/
3.1 需求抽象
上面主要说的是工具的用法,但其实这套解决方案的重点,并不在于这些具体的工具
回过头来,会发现每个工具都对应了特定的问题
实际上,每个问题对应的解决方案,也不是唯一的,也都有其他的选择
根据工具熟悉程度、二次开发难度、定价等情况,每个团队完全可以有不同的方案
但这个时候,你已经明白“具体的数据分析需求有哪些,可以怎样解决,用什么工具解决了”,而不是刚开始比较混沌的状态
这类组合方案的不足在于数据不在一处,需要在多个地方看数据,但就其节省的开发成本而言,我觉得是值得接受的
3.2 接下来?
(1) 可学习的
这里介绍的解决方案,背后实际是业界 best practice 的集合,而这些其实都是需要学习的,并不是拿到了工具就“会用”。比如,
对外,怎么用 Google Analytics? GA 的功能其实挺丰富的,但目前我还没看到比较好的教程
对内,是 Product Analytics 的范畴,比如这里对 Metabase 和 Mixpanel 的使用,比如我从产品本身,推出对"用户查看书籍"的关注,以及转化率的分析
这又涉及到了 2 点
(2) 可做的
上述这些内容,都是传统层面的分析,那有没有更 fancy 的做法呢?
比如,Ruby China 的用户,可不可以做特征分析,判断总共有哪几类人(e.g. 努力发帖,努力回帖,只看不回的,只点赞的),比例各是多少,行为特征是怎样的?以及对新用户,预测他将来会成为哪类用户,甚至鼓励他成为内容贡献者?
这就涉及到 machine learning、聚类了,在产品有了足够的数据积累之后,就能进一步做这些东西