部署 Rails 在高并发下的性价比

tangmonk · 2015年11月10日 · 最后由 losingle 回复于 2019年05月04日 · 9414 次阅读

现在有个项目，预计用户量在顶峰的时候会达到 10000 requests / few second

我计算了下，如何一个 request 需要耗费 0.1s，那么单进程单线程的话 1 秒钟就只能处理 10 个请求。如果用上 16 核服务器，puma 开启 16 个 process, 每个 process 开 10 个 thread，那么并发数量只能达到 1600。（以上情况不考虑缓存）

那么这样的话大概需要 10000 / 1600 = 6.25, 至少需要 6 台 16 核服务器，6 台 16 核服务的价格总共 7200 / 月。

这个价格也太贵了，这种 process/thread 的并发模型是不是太不给力了。

如果某个高频率的服务采用 Nodejs 的 event 并发模型，或者采用 erlang 的 actor 模型应该会有质量的提升吧。

huobazi #0 2015年11月10日

那么问题来了，7200/月能雇的来 @bhuztez 吗？逃.......... @bhuztez 请你保证不打死我。

2 个赞

tangmonk #1 2015年11月10日

#1 楼 @huobazi O(∩_∩)O~~ 真早

huacnlee #2 2015年11月10日

合适工具用合适场景！

1 个赞

psvr #3 2015年11月10日

高并发的部分建议抽出来单独用其他工具改写，例如 golang node.js

2 个赞

tangmonk #4 2015年11月10日

#3 楼 @huacnlee 站长达人，请问下 ruby china 的并发最高的时候能达到多少呢？

huacnlee #5 2015年11月10日

#5 楼 @tangmonk 顶多 50 个/s

所以你想太多了，10000 个/s，什么样的应用有这样的场景

tangmonk #6 2015年11月10日

#6 楼 @huacnlee 是一个游乐园，他们人流量在节假日大约有一万多人

huacnlee #7 2015年11月10日

#7 楼 @tangmonk 不是那样计算的

tangmonk #8 2015年11月10日

#8 楼 @huacnlee 哦哦。。那是我随便估计的。现在想想他们并发最高 1000 已经很不错了

tnt #9 2015年11月10日

改了语言不考虑改架构是耍流氓啊，也无非是把语言层先跑死换成后端数据库一类的服务先跑死。

1 个赞

yzdel2000 #10 2015年11月10日

就算节假日，人都是分批到来，那么做好 cache，后台队列，应付 1000/s 还是很容易的。做的一个 laravel 站，每天万 pv 访问，双核，2G 内存，都跑不满，是你太高估同时访问的人数了。而且 laravel 的并发比 rails 还要差点...

tangmonk #11 2015年11月10日

#11 楼 @yzdel2000 很多地方都是实时的，能做 cache 的地方很少

nine #12 2015年11月10日

#11 楼 @yzdel2000 我这儿只有 1 万多 ip，更多的是活活被爬虫跑死，700 万左右 http 请求/天。关键是做缓存没用，爬虫是挨个页面爬的，一个页面只爬一次。

psvr #13 2015年11月10日

@nine 是不是可以考虑在 nginx 层把来自爬虫的请求集中导入到一台廉价的、慢的后端服务器上

14 楼已删除

nine #15 2015年11月10日

#14 楼 @psvr 那爬虫会判定页面打开太慢，体验不好，而把搜索排名降低。。

wangkai2014 #16 2015年11月10日

你想多了 3g 内存 2 核 ssd 磁盘，日 ip8w pv70w 毫无压力 laravel

diguage #17 2015年11月11日

有人分享过“屌丝如何日访问量一百万”的演讲，你可以找找视频。

这是 PPT：屌丝程序员如何打造日 Pv 百万的网站架构

xiaoronglv #18 2015年11月11日

#9 楼 @tangmonk 按你的访问量，估计连 1000 request/second 都达不到。

可以先把云主机加到 6 台，看一下 newrelic 中的流量，观察一两周，然后根据流量调整实例的数量。

zhangsm #19 2015年11月12日

数据库瓶颈也是一个问题。

ywencn #20 2015年11月12日

10000 人每天的游乐园，撑死 1 个小时内到齐，每秒 3 个请求好么才。

sevk #21 2015年11月12日

10000 人每天的游乐园，撑死 1 个小时内到齐，每秒 3 个请求好么才。

Rei #22 2015年11月12日

可能游乐园有广播，某时某分有抽奖，倒数十秒一起抢。

billy #23 2015年11月12日

当开始数 10 的时候，楼主心跳开始加速

ywencn #24 2015年11月12日

游乐园搞个活动 7200 / 月不算高，你可以预算里面报 12000，还赚 5000 呢。。

msg7086 #25 2015年11月13日

10000 qps 这还是挺吓人的，你不用 20 台服务器还真的顶不下来。手头一个每天 IP 六七万的网站，每秒访问也才两三百，一个 VPS 就能吃下了。

到了 10000 qps 的话，每个月多掏 1 万根本不算什么，如果开公司的话最起码百万疯投拿好了吧？

small_fish__ #26 2016年03月26日

在讨论问题之前，先需要确定 0.1s 里面 cpu 耗时是多少，不然没有意义。

就你给出的描述，有一个点问题： puma开启16个process, 每个process开10个thread 并发数量其实只有 16*10 = 160，单位吞吐量 (/秒) 才是 1600 .

假设如果你的是 IO 密集型应用 , 比如 100ms 里面 20ms cpu, 80 ms IO (2/8 定理), 在这种情况下单个进程最好的线程数量是 100/20 = 5（因为多了没有意义）, 这样你的并发又减少到了 16* 5 = 80，单位吞吐量 (/秒) 才是 800，再根据常见的用户可忍受的等待时间 3 秒为例，你可以同时接 800*3 = 2400 请求。

接着如上假设，根据你的数据 10000 requests / second（持续一段时间），在这个高流量来之前，确实必须需要 > 10000/ 800 台机器 . 但是你可以使用云主机，实现弹性扩容，按时收费，这样整体便宜不少，例如青云，非高峰期保留两台主机即可。

1 个赞

tangmonk #27 2016年03月26日

#27 楼 @small_fish__ 多谢大大指教，但有几点疑问

关于 2/8 定理不太清除，查了下是关于财富分配啥的。。
100ms 里面 20ms cpu, 80 ms IO (2/8定理), 在这种情况下单个进程最好的线程数量是 100/20 = 5，为什么要 100/20 呢？
如何判断一次请求 CPU 的耗时和硬盘的耗时呢？

small_fish__ #28 2016年03月27日

#28 楼 @tangmonk

2/8 只是做个假设，具体项目中，cpu 和 IO 耗时可以通过 Rails 日志每个请求时间估计出来。
100/20 = 5 是因为 20ms 是 cpu 时间，那么一个 cpu 在 100ms 里面，最多 5 个 work 可以利用，如果超过 100ms，已经有 work 将上个任务处理完成，空闲出来了，又可以处理请求，这个只是大概数据。

1 个赞

kevinli #29 2017年01月14日

每秒 10000 个请求，一小时就是 3600 万个请求，往小了说，一天 3600 万个请求吧，这多少用户，养活一个几百人的公司都没有问题，还差个几千块啊。

losingle #30 2019年05月04日

对

kevinli 回复

看业务场景呢，我一个项目还 4W QPS 呢

但是还养不活 10 人的团队呢

还得想办法节约机器和流量成本

从 passenger 到 puma，然后换到了 nodejs

需要登录后方可回复, 如果你还没有账号请注册新账号