我们在开始用 Redshift 做数据仓库,不知道有人用过吗?使用场景是怎样的?有没有什么坑?谢谢!
坑就是基于旧版本的 pg 吧,citus 其实更好一些
#1 楼 @hooopo citus 看着不错,但我司应该没有精力去搞了。忘了在哪看到,Redshift 只能提供秒级响应吗?进不了毫秒级?
@hooopo citus 和 greenplum 什么区别
#2 楼 @hui 数据仓库需要毫秒级?
#3 楼 @jiang_plus 区别是 citus 是 pg 插件,greenplum 是 pg 的 fork。
#2 楼 @hui citus 也提供云服务的,不自己搭建也行。
#4 楼 @hooopo 我们在做一个给用户看的 dashboard,提供按天计的一些 events 的统计数字,现在两种思路,一种是直接查 Redshift 简单粗暴但是慢,第二种是数据流进来的时候直接加 counter,保存一个 aggregated 统计表,还在纠结中。
events 的数据量会比较大,一天几百万,这种适合引入时间维度的 dimension 表吗?谢谢!
找了一圈相关资料还是 @hooopo 的几篇数据仓库文章写的最好,手动给👍
@hui 可以看看 pipelinedb,基于 pg 的数据库流处理方案 http://pipelinedb.com/
#8 楼 @jiang_plus 谢谢!