数据库 有人用 AWS Redshift 吗?进来聊聊

hui · 2016年09月28日 · 最后由 hui 回复于 2016年10月14日 · 3435 次阅读

我们在开始用 Redshift 做数据仓库,不知道有人用过吗?使用场景是怎样的?有没有什么坑?谢谢!

坑就是基于旧版本的 pg 吧,citus 其实更好一些

#1 楼 @hooopo citus 看着不错,但我司应该没有精力去搞了。忘了在哪看到,Redshift 只能提供秒级响应吗?进不了毫秒级?

@hooopo citus 和 greenplum 什么区别

#2 楼 @hui 数据仓库需要毫秒级?

#3 楼 @jiang_plus 区别是 citus 是 pg 插件,greenplum 是 pg 的 fork。

#2 楼 @hui citus 也提供云服务的,不自己搭建也行。

#4 楼 @hooopo 我们在做一个给用户看的 dashboard,提供按天计的一些 events 的统计数字,现在两种思路,一种是直接查 Redshift 简单粗暴但是慢,第二种是数据流进来的时候直接加 counter,保存一个 aggregated 统计表,还在纠结中。

events 的数据量会比较大,一天几百万,这种适合引入时间维度的 dimension 表吗?谢谢!

找了一圈相关资料还是 @hooopo 的几篇数据仓库文章写的最好,手动给👍

@hui 可以看看 pipelinedb,基于 pg 的数据库流处理方案 http://pipelinedb.com/

需要 登录 后方可回复, 如果你还没有账号请 注册新账号