keepeye (大梦谁先觉)

折腾了两天，终于用 Elasticsearch + elasticsearch-rails 实现了搜索功能

keepeye — Sun, 16 Aug 2015 21:40:43 +0800

一开始折腾 sphinx，为了中文分词选择了 coreseek 这个二开版本，结果好不容易将 coreseek 编译成功，却发现 rails 对应的 gem 版本太高了，无奈放弃。

后来听别人介绍，发现 elasticsearch 不错，起码安装不费心力。

而且赞的是官方提供了 rails 包。

花了一整天，先阅读 elasticsearch 文档，搞清楚基本概念，然后结合 elasticsearch-rails 的文档就容易理解了。

然后花了点时间折腾中文分词的事情，最后选择了 elasticsearch-rtf 整合包，十分方便。

最后实现搜索业务，正式部署到 vps 上，成功跑起来，很高兴。

有个遗憾的地方是，rails 根据 response.records 得到的结果不包含高亮字段，左右在三，为了代码更加整洁就不要高亮功能了吧。

欢迎拍砖

keepeye — Thu, 13 Aug 2015 22:10:34 +0800

之前是用 PHP 框架 Laravel 写的，然后被诱惑来学习 ROR，经过差不多一个月的学习，头发都掉了好几根，终于感觉可以做点东西了。。

于是我把魔抓伸向了博客..

就在这周开始，到现在终于成功部署到 vps 上：

如果你们想对比下 Laravel 的话，看旧版博客：

跟我同是新人的你如果有什么想问的，留言吧！

老司机如果有什么建议，欢迎提出！

keepeye — Wed, 12 Aug 2015 10:46:07 +0800

给自己博客装了个 ueditor，为了节省时间就直接把整个源码扔到 public 里了，然后在 _form.html.erb 模板中加载 ueditor。

然后发现一个古怪的问题，发现点击页面中的链接打开 form 页面，ueditor 加载不出来，伴随 404 错误，感觉是缓存了之前的错误配置，刷新页面后就正常了。

chrome 调试工具里禁用缓存也无效，感觉不是浏览器的缓存。

最后绕了很久才怀疑到默认 js，里面有个不认识的 turbolinks ，删掉它页面就正常了。

keepeye — Sun, 02 Aug 2015 20:13:37 +0800

这是我论坛首贴，刚学 ruby 和 ror 半个月，现在想自己开发个项目练练手。

我是选择做一个小说站吧，先用 ror 快速搭了个架子，目前实现了分类、小说基本信息 (书名、作者、封面、介绍...) 两个模型。

第一阶段的打算是先从起点把小说基本信息采集下来录入数据库，大概一百多万部小说吧，之后再挂个常驻进程抓取每天更新的小说信息，并同步数据库。

现在爬虫我选择的 scrapy，一款 python 的异步网络爬虫吧，也是刚接触^^，爬虫规则部分已经写好了，现在的问题是如何入库，我想到的有两种方式：

1.在 scrapy 中 pipeline 中直接连接项目数据库，并进行读写操作。 2.在项目代码中暴露一个内部接口，scrapy 通过 http 协议将数据 post 到该接口，由 ror 统一进行入库操作。

方式 1 我觉得效率上要高，但要额外实现数据的验证。方式 2 我觉得能保证数据的可靠性，但比较担忧其性能问题。

各位大婶以为如何是好呢？