瞎扯淡有了解 node.js 的不,答疑一下吧

feitian124 · 2012年03月04日 · 最后由 fsword 回复于 2012年03月05日 · 5076 次阅读

今天点开 ruby-china 上的那个 node.js 的外链，在那社区里面闲逛，发现 node.js 很火。之前也零零星星的看过一些 node.js 的介绍，知道它是底层是 google v8 引擎的基于事件模型的服务器软件。但脑子有几个 why 一直挥之不去：

1.基于事件模型的理论并不新鲜，为什么没有在其他语言中实现。可能的原因是，其他语言都没有基于基于事件模型的概念或者习惯，而在浏览器里运行的 js 则处处都是事件，onclick，onmouseover 等等。

2.在不是基于事件的 http 请求中，客户端和服务器建立 tcp 连接（http 都是基于 tcp 吧），直到响应完毕，断掉 tcp 连接。而现在 node.js 中不收到请求后，通知客户端断掉 tcp 连接，并说我之后会把找到的东西发给你。问题来了：服务器端是怎么找到客户器端的呢？我们知道客户端去找服务器端是花了不少力气的，现 dns，再 ip；现在 tcp 断了，我不知道有什么机制能让服务器找到客户端？难道 node.js 不是用在这样的场景么？

好吧，精力有限，还来不及去研究这个问题的答案。哪位同学了解的话，解答一下吧。纯属解惑。

1 个赞

NodeJS 适合用来做什么？

无引用文章

clc3123 #0 2012年03月04日

1.python 和 ruby 都有事件驱动的相关库，node 不也是基于 c 的神马 libev 吗？这模型挺广泛的啊，大公司里的程序员搞这个的好像挺多的 2.连接保持着，不能断了，服务器处理完还走这个连接

fsword #1 2012年03月04日

@clc3123 说的没错，事件驱动这事已经不新鲜了，ruby 程序员可以找 EventMachine 这个库看看。

另外补充一下，处理后释放的是当前线程（所以可以单线程工作），但是 tcp 连接等资源还是继续保留的

alvin2ye #2 2012年03月04日

看看 http://www.infoq.com/cn/news/2011/09/nodejs-async-code

feitian124 #3 2012年03月04日

http://ruby-china.org/topics/962 看了这个帖子也是对 node 的讨论，但没找到我想知道的东西。 @clc3123 那如果都维持连接，那我可以这样理解么： java 维护开 1000 个线程维护 1000 个连接事件，有线程空间成本，阻塞成本 node 基于事件排序处理 1000 个连接，有队列对象的空间成本，排序成本

我咋觉得一样啊，换种理解，我排在第 1000 位的那个事件，还不是被前面 999 个阻塞着嘛

feitian124 #4 2012年03月04日

@fsword @alvin2ye 谢谢指点，对它的基本原理，我能理解的。不能理解的是问题 2 中的寻址问题，如果如你们所说 tcp 资源保留，疑问倒弱了很多。看来同步模型的阻塞成本很高。

soloara #5 2012年03月04日

这是一种非阻塞的设计，大约意思是你的 request 过来了，我 hold 住你的连接，把你的连接放进我的一个连接 pool 中，并注册成为一个事件，然后不再搭理这个请求，此时你的请求没有占用我什么资源。当事件被触发的时候，我把你的 http 连接找出来，再 response。其中客户端在服务器没有相应并释放这个连接之前是一直处于 wait 状态的。所以不是 tcp 断掉了，这个请求在服务器处理完事件并回返之前一直都没有释放的。

feitian124 #6 2012年03月04日

＠soloara 非常感谢，很详细的解答。我的疑问可以 close 了。

soloara #7 2012年03月04日

#4 楼 @feitian124 嗯，有意思的回答，不过响应 1000 个线程和维护 1000 个连接，服务器肯定觉得后者会更舒服的。

clc3123 #8 2012年03月04日

1000 个人来申请宽带，他们依次领完了申请表。有个官员就绕着圈专门检查这 1000 个人哪个已经填完申请了，1 号可能是最早进来的，但要是每次官员经过的时候 1 号都没做完，官员就检查下一个，如果下一个先做完了，官员就先让下一个进去办事。所以说 1 号甚至可能是最晚进去的，但他不会阻塞其他人。

feitian124 #9 2012年03月04日

＠clc3123 ＃9 呵呵，谢谢你写了这么多。不过你这个官员在多线程的 java 模型里也存在吧？某个线程先做完，肯定也是先返回了呀。

soloara #10 2012年03月04日

#9 楼 @clc3123 你这个例子不好，我听过一个经典的例子，有人去图书馆借书，打电话去问图书馆有这本书没有。A 图书管理员说，你不要挂我去给你找。B 图书管理员说，我知道了待会找到了我打电话给你，然后 B 就大叫 C 帮我看看 XXX 这本书有没有。结果就是 A 图书管理员在找书的时候别人要查书结果占线，而 B 管理员在 C 累死累活的时候接下了几个单。@clc3123 写完发现你的例子也挺好的。

ery #11 2012年03月05日

#6 楼 @soloara 解释地很不错，不过我也有些疑问？搭个车。

第一 1000 个 http 连接（或者说 n 个 tcp 连接）只对应一个服务器线程，是这样吗？

第二每个 http 连接都会有一个事件，那事件数量和线程数量的关系是什么哪？我的猜测是，node.js 后台有 n 个线程用来处理 x 个事件，n 和 x 没有直接关系，事件数量增加，不会导致线程数量的增加。我的猜测对吗？

soloara #12 2012年03月05日

#12 楼 @ery 第一条，“只对应”可以改为“可以只对应”。第二条，你的 http 连接可以不产生任何事件。比如我们在做服务器推送的时候，很多 waiting 的连接不过是为了侦听服务器的信息。

ery #13 2012年03月05日

#13 楼 @soloara 谢谢你的回答， 第一条 “可以只对应”很严谨，我认同。 第二条 你说，“你的 http 连接可以不产生任何事件”，这个我明白，但是，我的问题是，假如 1000 个 http 连接，每个连接都产生了一个事件，那事件数量和线程数量的关系是什么哪？

soloara #14 2012年03月05日

#14 楼 @ery 这个问题得看你自己怎么做了，比如 eventmachine 也没有管我们怎么处理逻辑。当然在 eventmachine 里面我以前的写法是基于事件的方式。只有一个线程。

soloara #15 2012年03月05日

#15 楼 sorry 说错了是 node.js，困死了。。。

zipme #16 0999年12月26日

nice

fsword #17 2012年03月05日

#14 楼 @ery 服务器的本质就是调用 cpu 根据状态机逻辑处理各种数据。

如果你有 1000 个任务，但都是要 cpu 做的，那么别搞花样，老老实实按顺序做是最快的方式，后面排队的任务也只好等着。

但是，如果这里面有任务被 hold 住了（比如读写 socket），那么这时 cpu 是空闲的，后面排队的任务处于有计算资源却不能使用的状况，这才是我们常说的“阻塞”，这时候我们最好的选择是——保留当前任务的工作现场，然后让 CPU“跳过”这个任务先做下一个。

然而，如何保留现场？具体做起来却不那么简单，这里有两个问题：1、如何处理多核/多 CPU 之间的共享；2、是否由 OS 负责

发现写起来有些收不住了，强行打住，有空补充

需要登录后方可回复, 如果你还没有账号请注册新账号

瞎扯淡 有了解 node.js 的不,答疑一下吧

瞎扯淡 有了解 node.js 的不,答疑一下吧

瞎扯淡有了解 node.js 的不,答疑一下吧

瞎扯淡有了解 node.js 的不,答疑一下吧