第十八期的 Teahour.fm podcast 我们已经请到了 Eric Redmond, Seven Databases in Seven Weeks 和 Little Riak Book 的作者,数据库和分布式系统的专家。
这期的主题会主要对各种数据库技术进行讨论,比较和选择时候的考虑因素。在这期节目里我们想做一个“闪电回答”的环节,大家在这里提问题,我们挑选一些让 Eric 回答。请最好问些大方向的问题,而不是类如某个数据库的某个参数怎么用,更适合 podcast 的形式。
是否有一些在项目开发后,因数据量变大或业务变更而进行查询优化的案例?会如何处理? 例如:因业务变更,数据的查询方式改变,原有的索引效果大打折扣,然后针对现有情况的优化。
在处理过程中碰到过一些什么 "坑" ?
Riak is an open source, distributed database. Riak is architected for: Availability, Fault-Tolerance, Operational Simplicity, Scalability. 请问 Eric Redmond,根据介绍,那么在单机的情况下 Riak 不能体现其优势是吗?有没有在单机的情况下使用 Riak 的案例?
假设你不得不自己去实现 Paxos,是不是得借助各种 proof assistant 来证明一下?现在哪个 proof assistant,对证明 Paxos 的支持比较好,和各种语言结合比较好?最好有 tutorial?
http://en.wikipedia.org/wiki/Formal_methods http://en.wikipedia.org/wiki/Coq http://en.wikipedia.org/wiki/Isabelle_%28proof_assistant%29
第二个,就是类似 OpenTSDB 这样的数据,要做多个 metric 之间的复杂的聚合,根据聚合出来的结果触发报警什么的。