数据库 MySQL 中多对多关系怎样进行 Scale

ShiningRay · 2012年07月08日 · 最后由 ShiningRay 回复于 2012年07月09日 · 5038 次阅读

我这里做的有几个场景一个是记录用户阅读过哪些文章，另一个场景是 tag 当关系表中记录达到几千万条的时候，读取插入性能都急剧下降，这时候该如何优化呢？

chucai #0 2012年07月08日

是否可以将这种关系保存在 redis 中？

Rei #1 2012年07月08日

垂直拆分或者水平拆分

reducm #2 2012年07月08日

#2 楼 @Rei 求详细，怎样是垂直怎样是水平呢？

ShiningRay #3 2012年07月08日

#2 楼 @Rei 水平拆分好理解，垂直拆分的话似乎已经没有什么可拆的了，把 tagging 放到单独的服务器上？而且水平拆分应该怎样进行，比如我既想知道这个用户读过哪些文章，又想知道这篇文章哪些用户读过

ShiningRay #4 2012年07月08日

#1 楼 @chucai 保存在 redis 中也涉及到如何 scale 的吧

Rei #5 2012年07月08日

#3 楼 @reducm 垂直拆分是按功能划分，比如新闻和博客都用了 Tag，那么把这两个功能的 Tag 拆开。水平拆分是按照时间段/用户名/其他分区方法把一张表拆开。我不熟拆表，不过看网上的资料说到 SQL 的扩展大都这样。

#4 楼 @ShiningRay 这篇文章被哪些用户读过一定需要查出全部吗？如果不是，可以做一个小的队列缓存。

reducm #6 2012年07月08日

#6 楼 @Rei 感谢，之前一直不太懂水平和垂直的问题，原来维度就是以表的角度

bhuztez #7 2012年07月08日

10M 这个数量级就要 sharding 了吗？用 memcache 和 redis 当缓存撑不住？

quakewang #8 2012年07月09日

@ShiningRay 你这种需求属于对于 many-to-many 的中间表做水平切分，并且对双向的 many 都需要查询，常见做法是建立 2 个表，以用户阅读文章为例，一个表根据 user_id 做切分（hash or range shard)，另外一个表根据 topic_id 做切分，index 在 2 个表上分开对 user_id 和 topic_id 来建立。创建新记录的时候，需要往这 2 张表都要插入一样的数据。查询的时候，先看是从哪个方向的 many 来查询，然后再做普通的 shard db lookup.

匿名 #9 2012年07月09日

啊哈，楼上正解，如果真到那个量级，不过 save 的时候就得做两次了

ShiningRay #10 2012年07月09日

#8 楼 @bhuztez 未雨绸缪，嗯

需要登录后方可回复, 如果你还没有账号请注册新账号

共收到 11 条回复

收到新回复，点击立即加载