说说个人看法,我不是 ruby 高手,但是就像@lgn21st 说得一样,但我知道怎么快速的用 google 解决自己遇到的问题,而且我们也不需要第二个 OverStack;我愿意看到一些有质量的帖子,当然这是一个 ruby 社区,有高手,有熟手,有新手,这样的话我更愿意看到一些积极的讨论,同样的问题,不同的解决方法,深入的分析等等,大家都可以参与。
我似乎也遇到过一次,没有深究当时。。。
+1
看了下套餐,确实很便宜啊。。。
MongoDB 里面不要过多的使用第一种结构,会引起问题的
#9 楼 @musicflow 看到你这个网站有一段时间了,感觉挺不错的;就是访问速度有待提高.。。
是的,不过现在注册比较简单,个人介绍里面稍微写点东西,比如表示自己编程方面比较 NB,一两分钟之内就有人给你发邀请了
我觉得还是上 Quora 吧
那个 Ruby China 不仔细看都以为没了。。。。汗
支持一个,确实见过某些用 ruby 的人离开了 rails 就不会写东西了
为什么大多数程序员的显示器都不大?
最近在看一些 emula 相关的东西,涉及到 Chord 算法,刚好也是一种一致性哈希的实现;就是#3 楼 @Saito 说的这个原理, @ptmagic 你可以看看,这有一篇简介:http://blog.csdn.net/chen77716/article/details/6059575
instagram 重要的是后台,海量数据的存储、查询和水平扩展;对前台更多的是提供 api,因此如果是我我也会放弃 rails;即使要用 ruby 也会和 #3 楼 一样,用更轻量级的框架。
查看下 log 目录下 solr 的日志
是分词效果不好?是的话可以为 solr 配置中文支持更好的几个分词器,如 IK、mmseg4j
+1,这个我也订很久了,值得推荐
哦,我以为是 BOM header 问题呢
我还是继续用 CloudFoundry 吧,免费,配置也较高,而且访问速度很好 :) 新浪的文档中心做得太烂了
如果你只是针对某个特定的网站来抓,问题不大吧,搞清楚 html 结构再结合 xpath 之类,解析比较容易,我曾经用 nokogiri 把一个网页里面我需要的 javascript 数据都弄下来了; 如果要针对一堆网站抓数据,可以参考一些算法之类的,不管具体的 html 结构而采用统一的方法分析;我也尝试过,抓取的准确性还不错。
是海量数据处理不是存储?如果是尝试过 MapReduce 没有?我用 Hadoop 来处理; 没有用 Ruby 处理,别拍我 :)