瞎扯淡 一个简单的数据分析解决方案,可能适合中小团队

cqcn1991 · August 19, 2018 · Last by cqcn1991 replied at August 19, 2018 · 5066 hits

许久都没冒泡了。。。这次写一个我想了很久才搞明白的问题

国内相关文章并不多,涉及的工具、概念也算比较新,所以在这里写一下,希望帮到有同样困惑的人


一般小团队存在的问题

  • 不知道能用数据干什么
  • 没有足够的资源写 SQL(专人、时间或者方法);想用工具,但不知道有什么合适的数据工具可以用

目前,我发现了一套解决方案,能基本满足小团队早期的数据需求,以下以我自己的网站为例进行介绍

一、产品与需求背景

地址:http://learnbyreading.herokuapp.com/

我这个网站是个爬虫站,定期自动爬取 Amazon 的书籍数据,并做简单的统计分析,呈现出近期的好书,方便我找书看

那么,对这个产品,我有哪些数据上的需求、问题呢?

  • 我要分析爬到书籍的数据:比如书总体的评分分布是怎样的?哪个类别下哪些书评价好、评价差?最近更新了哪些书?
  • 我想知道有多少人在用这个网站,这个网站能为别人带来多大价值

二、解决方案

(1) Metabase

用 Metabase 连接网站的数据库,就可以直接做分析,上图是我做出来的 dashboard, 包括了当前书的数量、评分的分布等等

具体使用也很简单,用的 query builder 就行

(2) Google Analytics

这个大部分人都很熟,在网站/App 里嵌套好就行,可看网站的访问量、流量来源、地区分布等等

不过仅仅这样的话,也不需要什么解决方案了

因为。。。。。其实还有新的数据分析的需求

(3) Mixpanel

随着对数据分析学习的深入,我知道了可以做更多的分析来分析产品的好坏

比如说,我这个产品的目的,是帮助用户们找到更多的好书

所以核心的指标,其实是“用户点开了书”

用户访问的书越多,说明帮他们找到潜在感兴趣的书也越多。如果满屏都是不感兴趣的书,用户是不会点的,也说明我的产品没有达到目的。另外,网站还能显示书评的详细内容,我也想知道有多少用户查看了

这个时候,就要用到埋点(tracking)了

开发好后(i.e. 把大象放到冰箱之后),就能看到用户访问了某本书,是否查看了 review 的事件,这个是通过 Mixpanel 做到的

也能看到每天各个事件的统计量,我也能知道用户查看的书最多是什么,使用哪类跳转最多

此外,网站一个核心的指标,就是查看页面 -> 查看书籍的转化率,用漏斗分析可以做

可以看到转化率还是挺低的

不过,如果你对 GA 熟悉,会知道 GA 也是能埋点的,那为什么要用 Mixpanel, 而不用 GA 呢?

因为 GA 对于分析的支持并不够,像上述的漏斗、事件分析,GA 做起来是很困难的,而 Mixpanel 简单操作就行了,类似的还有多重事件定义、用户人群的分析。也就是说

  • Google Analytics: 开箱即用,打开就能看到各种数据,比如每天的访问量、渠道流量来源、留存量。主要用于对外的流量分析
  • Mixpanel: 做了埋点才能有数据,没有默认的数据看板可以看,需要自己配置、分析。主要用于对产品自身的分析

需要注意的是,Mixpanel 目前的 UX 比较差,功能有很多,但没讲明白到底干嘛的。简单来说,包含了 2 大块

  • 查询分析:即目前的 Insight/Segment 功能,用于直接查询、分析各类 event 的属性、趋势
  • 分析方法论:即目前的 Funnel/Retention/Signal/Predict/People 等功能,分别对应是的常用的分析方便,比如漏斗分析,留存分析,关联、预测行为,用户分类等等

(4) Segment

除了 GA,Mixpanel, 可能你还要用到其他的外部工具(比如 Amplitude),这时就有个头疼的问题了,因为这些代码都很相似,但是都需要反复开发、调试

这时,就可以用到 Segment

Segment 对埋点类工具做了抽象,也就是说,只开发 Segment 的代码一次,然后再通过配置就能开启 GA, Mixpanel 以及其他的工具,适配的工作交给 Segment 来做就行了

我这里就是 Google Analytics + Mixpanel + Amplitude 同时开启了的,方便对比产品功能

更重要的是两点

  • 开启了类似产品的大地图,可以考虑更多的工具,而不被某一款限制住
  • 可以通过 Segment 把采集数据发给自己的数仓,把数据保存下来,以便后续使用

可以简单的把 Segment 理解成 Stripe for Analytics. 类似于电商做支付的时候需要对接很多平台,而 Stripe 把这些都做好了,我们调用就行

至于能用的其他的工具有哪些?可以看 Segment 自己的介绍

https://segment.com/academy/intro/navigating-the-sea-of-customer-data-tools/

三、总结

3.1 需求抽象

上面主要说的是工具的用法,但其实这套解决方案的重点,并不在于这些具体的工具

回过头来,会发现每个工具都对应了特定的问题

  • Metabase: 用于分析数据库内的数据
  • Google Analytics: 用于分析外部流量来源,开箱即用,主要对外
  • Mixpanel: 用于分析产品自身状况,需要设计好埋点的方案,主要对内
  • Segment: 用于简化埋点类工具的开发,开发一次,然后做配置就行

实际上,每个问题对应的解决方案,也不是唯一的,也都有其他的选择

  • Metabase 类似的,还有 Superset, Redash
  • GA 类似的,是 CNZZ/友盟
  • Mixpanel 类似的,是 Amplitude 与神策

根据工具熟悉程度、二次开发难度、定价等情况,每个团队完全可以有不同的方案

但这个时候,你已经明白“具体的数据分析需求有哪些,可以怎样解决,用什么工具解决了”,而不是刚开始比较混沌的状态

这类组合方案的不足在于数据不在一处,需要在多个地方看数据,但就其节省的开发成本而言,我觉得是值得接受的

3.2 接下来?

(1) 可学习的

这里介绍的解决方案,背后实际是业界 best practice 的集合,而这些其实都是需要学习的,并不是拿到了工具就“会用”。比如,

对外,怎么用 Google Analytics? GA 的功能其实挺丰富的,但目前我还没看到比较好的教程

对内,是 Product Analytics 的范畴,比如这里对 Metabase 和 Mixpanel 的使用,比如我从产品本身,推出对"用户查看书籍"的关注,以及转化率的分析

这又涉及到了 2 点

(2) 可做的

上述这些内容,都是传统层面的分析,那有没有更 fancy 的做法呢?

比如,Ruby China 的用户,可不可以做特征分析,判断总共有哪几类人(e.g. 努力发帖,努力回帖,只看不回的,只点赞的),比例各是多少,行为特征是怎样的?以及对新用户,预测他将来会成为哪类用户,甚至鼓励他成为内容贡献者?

这就涉及到 machine learning、聚类了,在产品有了足够的数据积累之后,就能进一步做这些东西

感觉写得太啰嗦了。。。。等下再改改

好文,我也在用 metabase

ga 漏斗分析留存分析什么的都可以的…

Reply to hooopo

GA 整体分析都不太够用 拿漏斗来说,可以选择某个事件的状态吗??比如,只想用这个事件某个条件下作为漏斗的一环 再比如留存,如果对于留存的定义不同呢?或者想看某类人群的留存?

You need to Sign in before reply, if you don't have an account, please Sign up first.