<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0">
  <channel>
    <title>keepeye (大梦谁先觉)</title>
    <link>https://ruby-china.org/keepeye</link>
    <description>空山新雨后，自挂东南枝</description>
    <language>en-us</language>
    <item>
      <title>折腾了两天，终于用 Elasticsearch + elasticsearch-rails 实现了搜索功能</title>
      <description>&lt;p&gt;一开始折腾 sphinx，为了中文分词选择了 coreseek 这个二开版本，结果好不容易将 coreseek 编译成功，却发现 rails 对应的 gem 版本太高了，无奈放弃。&lt;/p&gt;

&lt;p&gt;后来听别人介绍，发现 elasticsearch 不错，起码安装不费心力。&lt;/p&gt;

&lt;p&gt;而且赞的是官方提供了 rails 包。&lt;/p&gt;

&lt;p&gt;花了一整天，先阅读 elasticsearch 文档，搞清楚基本概念，然后结合 elasticsearch-rails 的文档就容易理解了。&lt;/p&gt;

&lt;p&gt;然后花了点时间折腾中文分词的事情，最后选择了 elasticsearch-rtf 整合包，十分方便。&lt;/p&gt;

&lt;p&gt;最后实现搜索业务，正式部署到 vps 上，成功跑起来，很高兴。&lt;/p&gt;

&lt;p&gt;有个遗憾的地方是，rails 根据 response.records 得到的结果不包含高亮字段，左右在三，为了代码更加整洁就不要高亮功能了吧。&lt;/p&gt;

&lt;p&gt;有兴趣可以去看看：&lt;a href="http://www.ekan001.com/search" rel="nofollow" target="_blank"&gt;http://www.ekan001.com/search&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;欢迎拍砖&lt;/p&gt;</description>
      <author>keepeye</author>
      <pubDate>Sun, 16 Aug 2015 21:40:43 +0800</pubDate>
      <link>https://ruby-china.org/topics/26949</link>
      <guid>https://ruby-china.org/topics/26949</guid>
    </item>
    <item>
      <title>经过近一个月的学习，我把博客用 Rails 重写了，你们有什么想问的</title>
      <description>&lt;p&gt;之前是用 PHP 框架 Laravel 写的，然后被诱惑来学习 ROR，经过差不多一个月的学习，头发都掉了好几根，终于感觉可以做点东西了。。&lt;/p&gt;

&lt;p&gt;于是我把魔抓伸向了博客..&lt;/p&gt;

&lt;p&gt;就在这周开始，到现在终于成功部署到 vps 上：&lt;/p&gt;

&lt;p&gt;&lt;a href="http://www.ekan001.com/" rel="nofollow" target="_blank"&gt;http://www.ekan001.com/&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;如果你们想对比下 Laravel 的话，看旧版博客：&lt;/p&gt;

&lt;p&gt;&lt;a href="http://old.ekan001.com/" rel="nofollow" target="_blank"&gt;http://old.ekan001.com/&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;跟我同是新人的你如果有什么想问的，留言吧！&lt;/p&gt;

&lt;p&gt;老司机如果有什么建议，欢迎提出！&lt;/p&gt;</description>
      <author>keepeye</author>
      <pubDate>Thu, 13 Aug 2015 22:10:34 +0800</pubDate>
      <link>https://ruby-china.org/topics/26916</link>
      <guid>https://ruby-china.org/topics/26916</guid>
    </item>
    <item>
      <title>去掉 turbolinks 没问题吧？它导致我编辑器加载不出来</title>
      <description>&lt;p&gt;给自己博客装了个 ueditor，为了节省时间就直接把整个源码扔到 public 里了，然后在 &lt;code&gt;_form.html.erb&lt;/code&gt; 模板中加载 ueditor。&lt;/p&gt;

&lt;p&gt;然后发现一个古怪的问题，发现点击页面中的链接打开 form 页面，ueditor 加载不出来，伴随 404 错误，感觉是缓存了之前的错误配置，刷新页面后就正常了。&lt;/p&gt;

&lt;p&gt;chrome 调试工具里禁用缓存也无效，感觉不是浏览器的缓存。&lt;/p&gt;

&lt;p&gt;最后绕了很久才怀疑到默认 js，里面有个不认识的 &lt;code&gt;turbolinks&lt;/code&gt; ，删掉它页面就正常了。&lt;/p&gt;</description>
      <author>keepeye</author>
      <pubDate>Wed, 12 Aug 2015 10:46:07 +0800</pubDate>
      <link>https://ruby-china.org/topics/26886</link>
      <guid>https://ruby-china.org/topics/26886</guid>
    </item>
    <item>
      <title>用其他爬虫工具  scrapy 采集的内容如何发布到 Rails 项目中呢？</title>
      <description>&lt;p&gt;这是我论坛首贴，刚学 ruby 和 ror 半个月，现在想自己开发个项目练练手。&lt;/p&gt;

&lt;p&gt;我是选择做一个小说站吧，先用 ror 快速搭了个架子，目前实现了分类、小说基本信息 (书名、作者、封面、介绍...) 两个模型。&lt;/p&gt;

&lt;p&gt;第一阶段的打算是先从起点把小说基本信息采集下来录入数据库，大概一百多万部小说吧，之后再挂个常驻进程抓取每天更新的小说信息，并同步数据库。&lt;/p&gt;

&lt;p&gt;现在爬虫我选择的 scrapy，一款 python 的异步网络爬虫吧，也是刚接触^^，爬虫规则部分已经写好了，现在的问题是如何入库，我想到的有两种方式：&lt;/p&gt;

&lt;p&gt;1.在 scrapy 中 pipeline 中直接连接项目数据库，并进行读写操作。
2.在项目代码中暴露一个内部接口，scrapy 通过 http 协议将数据 post 到该接口，由 ror 统一进行入库操作。&lt;/p&gt;

&lt;p&gt;方式 1 我觉得效率上要高，但要额外实现数据的验证。
方式 2 我觉得能保证数据的可靠性，但比较担忧其性能问题。&lt;/p&gt;

&lt;p&gt;各位大婶以为如何是好呢？&lt;/p&gt;</description>
      <author>keepeye</author>
      <pubDate>Sun, 02 Aug 2015 20:13:37 +0800</pubDate>
      <link>https://ruby-china.org/topics/26736</link>
      <guid>https://ruby-china.org/topics/26736</guid>
    </item>
  </channel>
</rss>
