瞎扯淡 一个简单的数据分析解决方案,可能适合中小团队

cqcn1991 · 2018年08月19日 · 最后由 cqcn1991 回复于 2018年08月19日 · 2718 次阅读

许久都没冒泡了。。。这次写一个我想了很久才搞明白的问题

国内相关文章并不多,涉及的工具、概念也算比较新,所以在这里写一下,希望帮到有同样困惑的人


一般小团队存在的问题

  • 不知道能用数据干什么
  • 没有足够的资源写SQL(专人、时间或者方法);想用工具,但不知道有什么合适的数据工具可以用

目前,我发现了一套解决方案,能基本满足小团队早期的数据需求,以下以我自己的网站为例进行介绍

一、产品与需求背景

地址: http://learnbyreading.herokuapp.com/

我这个网站是个爬虫站,定期自动爬取Amazon的书籍数据,并做简单的统计分析,呈现出近期的好书,方便我找书看

那么,对这个产品,我有哪些数据上的需求、问题呢?

  • 我要分析爬到书籍的数据:比如书总体的评分分布是怎样的?哪个类别下哪些书评价好、评价差?最近更新了哪些书?
  • 我想知道有多少人在用这个网站,这个网站能为别人带来多大价值

二、解决方案

(1) Metabase

用Metabase连接网站的数据库,就可以直接做分析,上图是我做出来的dashboard, 包括了当前书的数量、评分的分布等等

具体使用也很简单,用的query builder就行

(2) Google Analytics

这个大部分人都很熟,在网站/App里嵌套好就行,可看网站的访问量、流量来源、地区分布等等

不过仅仅这样的话,也不需要什么解决方案了

因为。。。。。其实还有新的数据分析的需求

(3) Mixpanel

随着对数据分析学习的深入,我知道了可以做更多的分析来分析产品的好坏

比如说,我这个产品的目的,是帮助用户们找到更多的好书

所以核心的指标,其实是“用户点开了书”

用户访问的书越多,说明帮他们找到潜在感兴趣的书也越多。如果满屏都是不感兴趣的书,用户是不会点的,也说明我的产品没有达到目的。另外,网站还能显示书评的详细内容,我也想知道有多少用户查看了

这个时候,就要用到埋点(tracking)了

开发好后(i.e. 把大象放到冰箱之后),就能看到用户访问了某本书,是否查看了review的事件,这个是通过Mixpanel做到的

也能看到每天各个事件的统计量,我也能知道用户查看的书最多是什么,使用哪类跳转最多

此外,网站一个核心的指标,就是查看页面 -> 查看书籍的转化率,用漏斗分析可以做

可以看到转化率还是挺低的

不过,如果你对GA熟悉,会知道GA也是能埋点的,那为什么要用Mixpanel, 而不用GA呢?

因为GA对于分析的支持并不够,像上述的漏斗、事件分析,GA做起来是很困难的,而Mixpanel简单操作就行了,类似的还有多重事件定义、用户人群的分析。也就是说

  • Google Analytics: 开箱即用,打开就能看到各种数据,比如每天的访问量、渠道流量来源、留存量。主要用于对外的流量分析
  • Mixpanel: 做了埋点才能有数据,没有默认的数据看板可以看,需要自己配置、分析。主要用于对产品自身的分析

需要注意的是,Mixpanel目前的UX比较差,功能有很多,但没讲明白到底干嘛的。简单来说,包含了2大块

  • 查询分析: 即目前的Insight/Segment功能,用于直接查询、分析各类event的属性、趋势
  • 分析方法论: 即目前的Funnel/Retention/Signal/Predict/People等功能,分别对应是的常用的分析方便,比如漏斗分析,留存分析,关联、预测行为,用户分类等等

(4) Segment

除了GA,Mixpanel, 可能你还要用到其他的外部工具(比如Amplitude),这时就有个头疼的问题了,因为这些代码都很相似,但是都需要反复开发、调试

这时,就可以用到Segment

Segment 对埋点类工具做了抽象,也就是说,只开发Segment的代码一次,然后再通过配置就能开启GA, Mixpanel以及其他的工具,适配的工作交给Segment来做就行了

我这里就是Google Analytics + Mixpanel + Amplitude 同时开启了的,方便对比产品功能

更重要的是两点

  • 开启了类似产品的大地图,可以考虑更多的工具,而不被某一款限制住
  • 可以通过Segment把采集数据发给自己的数仓,把数据保存下来,以便后续使用

可以简单的把Segment理解成Stripe for Analytics. 类似于电商做支付的时候需要对接很多平台,而Stripe把这些都做好了,我们调用就行

至于能用的其他的工具有哪些?可以看Segment自己的介绍

https://segment.com/academy/intro/navigating-the-sea-of-customer-data-tools/

三、总结

3.1 需求抽象

上面主要说的是工具的用法,但其实这套解决方案的重点,并不在于这些具体的工具

回过头来,会发现每个工具都对应了特定的问题

  • Metabase: 用于分析数据库内的数据
  • Google Analytics: 用于分析外部流量来源,开箱即用,主要对外
  • Mixpanel: 用于分析产品自身状况,需要设计好埋点的方案,主要对内
  • Segment: 用于简化埋点类工具的开发,开发一次,然后做配置就行

实际上,每个问题对应的解决方案,也不是唯一的,也都有其他的选择

  • Metabase 类似的,还有Superset, Redash
  • GA类似的,是CNZZ/友盟
  • Mixpanel类似的,是Amplitude与神策

根据工具熟悉程度、二次开发难度、定价等情况,每个团队完全可以有不同的方案

但这个时候,你已经明白“具体的数据分析需求有哪些,可以怎样解决,用什么工具解决了”,而不是刚开始比较混沌的状态

这类组合方案的不足在于数据不在一处,需要在多个地方看数据,但就其节省的开发成本而言,我觉得是值得接受的

3.2 接下来?

(1) 可学习的

这里介绍的解决方案,背后实际是业界best practice的集合,而这些其实都是需要学习的,并不是拿到了工具就“会用”。比如,

对外,怎么用Google Analytics? GA的功能其实挺丰富的,但目前我还没看到比较好的教程

对内,是Product Analytics的范畴,比如这里对Metabase和Mixpanel的使用,比如我从产品本身,推出对"用户查看书籍"的关注,以及转化率的分析

这又涉及到了2点

(2) 可做的

上述这些内容,都是传统层面的分析,那有没有更fancy的做法呢?

比如,Ruby China的用户,可不可以做特征分析,判断总共有哪几类人(e.g. 努力发帖,努力回帖,只看不回的,只点赞的),比例各是多少,行为特征是怎样的? 以及对新用户,预测他将来会成为哪类用户,甚至鼓励他成为内容贡献者?

这就涉及到machine learning、聚类了,在产品有了足够的数据积累之后,就能进一步做这些东西

共收到 4 条回复

感觉写得太啰嗦了。。。。等下再改改

好文,我也在用metabase

ga漏斗分析留存分析什么的都可以的…

hooopo 回复

GA整体分析都不太够用 拿漏斗来说,可以选择某个事件的状态吗??比如,只想用这个事件某个条件下作为漏斗的一环 再比如留存,如果对于留存的定义不同呢?或者想看某类人群的留存?

需要 登录 后方可回复, 如果你还没有账号请点击这里 注册