• 首先支持一下楼主用 ruby 做数据分析一类的工具。目前 ruby 在这方面确实应用不多。

    有两个问题想讨论下:

    1. 为什么用 mongodb 做数据分析?个人感觉 mongodb 不是适合做数据分析工具的,虽然存储数据比较随意,不用固定格式,但是查询功能偏弱,不像 sql 可以很灵活
    2. 关于 join 和多维度数据合并 目前来看好像这个工具不支持 join 和多维度数据合并。其实在真正的数据分析工作中,会碰到各种各样要从不同纬度合并数据的情况。比如类似网站的流量数据在 Hive 里,网站的商品信息在 sql 数据库里,或者不同部门用不同的数据库 (Mysql/Postgresql/Sql Server ...). 我们就碰到了以上各种情况。

    我们目前用 ruby 写好了到各种数据库/Hive/以及读取 csv 的统一接口,然后可以很简单得从各来源取数据,定期更新数据合并到一块后,可以再导到表里或者导出成 excel 去分析。ruby 起到数据粘合剂的作用。而合并数据后的分析,目前也没有发现有什么 ruby 工具,所以都是导 excel 或者用 R 语言再去分析。

    希望 ruby 在真正的数据分析这块儿能再强大些吧。R 语言是很好的分析语言,但毕竟还是所有事情都放在一个语言里做比较好。

  • @numberaugust @54ebb 请问这里的 SEM 操作系统指的是在百度等搜索引擎上管理投放的 SEM 系统,还是给携程艺龙等客户用的 SEM 投放系统呢?