自上周 基于 Mongoid/ActiveRecord 的 statlysis 统计分析引擎 在 Ruby China 正式发布以来,收到不少同学们的反馈,相关数据整理如下:
- 帖子被浏览 500 多次,被 8 人喜欢。
- 在 github 收到 18 个 Star 和 3 个 Fork,这个算是起点吧。
- 向 Strikingly 的 CTO @dfguo ,课程格子的 CEO @tstyle11 ,和去哪儿网的某招聘负责人 @numberaugust 推荐了一下,均收到了表示要试用的意愿。
- 和 Rabel 社区软件作者 @daqing 在车库咖啡请教过推广方面事情,他对这类服务还是持保留意见。
个人觉得目前推广和使用还是不太给力,分析原因可能有,
- 受众采用的数据分析工具为两极分化严重的 SQL 和 Hadoop,分别对应一般的小公司和更专业的大公司,在习惯上没有做好接受的准备
- 项目在文档支持上还不够完善
- 目前没有 UI
- 数据本身属于公司内部敏感信息
- 再可能就是目前宣传还不够给力:)
线下培训
因此我想在近段时间作一场 statlysis 的 线下培训 ,场地可以是贝塔咖啡,或者近期活动的 Beijing Rails Girl 举办点 ThoughtWorks。
Beijing Ruby Saturday 主要组织者 @sundevilyang 不知是否对此感兴趣,也可以作为 Ruby Saturday 的一部分。
欢迎数据挖掘方面的专家 @ouyang 阳志平老师提建议,statlysis 第一次介绍还是在他家客厅,那时 Beijing Ruby 正在商讨如何负责国外讲师的来国内的接机和导游等安排。
也欢迎其他感兴趣的人来一起集思广益:)
培训内容就是做出一个满足若干个统计分析需求的后台,类似用户注册量等。
寻商业公司合作
由于项目的特殊性,需要提供数据来做统计分析(否则就只能写爬虫或 ETL 其他数据了),这方面不知道有无商业公司愿意开放部分无隐私或机密性数据来作为培训 Demo 的数据来源。这也算是赞助吧,欢迎联系我:)
项目地址:http://github.com/mvj3/statlysis
statlysis 统计分析引擎支持的功能列表如下:
- 支持 Mongoid 和 ActiveRecord 两种 ORM,其中 Mongoid 以 MapReduce 方式统计,ActiveRecord 基于纯 SQL 操作。
- 对统计结果进行 SQL 索引,以支持高效访问。
- 支持单行 DSL 配置,链式风格。
- 支持跨表统计,需结构相同,表名按日期分割。
- 依据统计需求自动配置统计结果的存储表,并支持条件查询,返回 ORM 统计表。
- 支持任意维度统计,其中时间维度可选。
- 单次统计里支持多个 GroupConcat 字段。
- 支持最近统计的时间。
- 支持以整数类型存储的时间字段,以兼容 PHP 社区的特别约定。
Demo 和成功案例
-
手把手操作示例 ,是用很酷的模拟终端的 showterm 工具录制的。
- eoe.cn 各子网站的页面访问统计,和包含多个条件的数据库表每日数据统计,详情见 示例配置文件 ,按日期维度分。
- 阳光书屋的学习提高班的关于做题情况的统计分析,详情见 示例配置文件 ,按班级维度分。
将来要做的事
P.S: 我会在 ThoughtWorks 2014.01.11(也就是下周六)举办的 Rails Girls Beijing 活动上当教练,欢迎一起讨论:)
本人联系方式 https://github.com/mvj3 ,微博 @mvj3
最后做一个求职广告
本人目前待业,欲寻优秀团队来一起工作,期待一半人是 Geek,另一半人是其他角色,其中一半人的综合水平在我之上,团队之间沟通信息公开,尊重专业人士建议,最后产品靠谱是硬需求。