gyorou · 回帖 · Ruby China

会员

第 11524 位会员 / 2014-02-14

[email protected]

Rakuten Inc.

东京

13 篇帖子 / 245 条回帖

16 关注者

0 正在关注

0 收藏

GitHub Public Repos

wechat_auth_server 10

a ruby wechat auth server
coin_chat 1
mesan-nodejs-auth-crud... 0

NodeJS Authentication and CRUD operations API -: Email Verification, Image Upload, Password Reset
yii 0

Yii PHP Framework 1.1.x
iptv 0
lengshuiyulangcn.githu... 0

blog host
phan 0

Phan is a static analyzer for PHP. Phan prefers to avoid false-positives and attempts to prove in...
awesome-nem-projects 0

A curated list of projects using NEM (New Economy Movement)
begsay 0

terminal table to show your crypto currency and stock assets
til-nem 0

hexo static assets to hold a blog fetched from nem-blockchain

More on GitHub

有人试过在 win 平板上编程吗 at 2014年10月21日

还是 cygwin 吧，板子折腾不起虚拟机。记得买个蓝牙键盘。
Enumerator::Lazy 是干什么的？ at 2014年10月21日

学习了。不过建议把第一段代码下面的"方法"改成"写法"，method 也是方法，这样的话会混淆起来，让读者云里雾里。
Ruby 实现的机器学习库有哪些？ at 2014年10月19日

说到底用 ruby 只是方便调用而已。可以用 mahout 啊什么的生成识别器模型（不过是一堆数值而已）之后，用 ruby 来读取识模型和需要分类的数据进行判断。
有没有啥爬虫案例可供参考的啊？ at 2014年10月13日

#6 楼 @cisolarix 没学过写代码什么规范。等踏上社会再等慢慢被调教了。
在 view 里 will_paginate 一个数组 at 2014年10月12日
为什么不把数组转换成 activerecord 类型。比如我有一个包含了很多 post 的 id 的数组，需要的是 post 的 activerecord 类型，那么可以这样。
```
#ids: array of id
@posts=Post.where(:id=>ids)
```

有没有啥爬虫案例可供参考的啊？ at 2014年10月12日

打个酱油。

require "mechanize"
# ruby aichen.rb pagenmber
url="http://www.aisex.com/bt/thread.php?fid=14&page="
page_num=ARGV[0]
agent=Mechanize.new
agent.user_agent_alias = 'Windows IE 9'
file="pics/"
        page=agent.get(url+page_num)
        file=file+page_num+"/"
        page.links_with(:text => /\[\d+P\]/).each do |link|
                puts link.href
                imgcount=0
                next_page=link.click
                subfile=next_page.at('h1#subject_tpc').content
                puts subfile
                next_page.images_with(:src => /jpg/).each do |img|
                        puts img.url
                        begin
                        img.fetch.save(file+subfile+"/"+imgcount.to_s+".jpg")
                        rescue
                                puts "can not get this one"
                        end
                        imgcount+=1
                end
        end

安装 Nokogirl 错误，急救！ at 2014年10月07日

在 windows 上装需要扩展支持的库就是活折腾。最好的解决方法就是放弃在 windows 上使用 ruby。另外 nokogirl 这个名字不错哈哈。
看美女的 Node.js 项目 at 2014年09月10日

想起以前写过把某城贴图区黄图爬下来的脚本
Rails 开发中常犯的 10 个错误 at 2014年09月05日

只看了前三个问题就感觉是在泛泛而谈。
出来混的迟早的滚回老家 at 2014年08月21日

#20 楼 @lostleaf 虽然实力什么的也很重要，我讲最重要的一点，这个和追妹子一个道理。就是要看老板的研究室有没有空缺或者是招人的需求。没需求你再牛也白搭。有需求而且你能满足这样的需求，那就 ok 了。
出来混的迟早的滚回老家 at 2014年08月21日

#14 楼 @steve 一心想要滚回老家却被这样一番鼓励情何以堪。虽然自己比较讨厌走一步算一步，不过在未来几年未知数还是太多。谢谢前辈鼓励。 #15 楼 @greatghoul 看到最近沸沸扬扬的小保方晴子事件突然感觉女博士的确是第三种性别了，半生殖隔离。 #18 楼 @jjym 国外圈子小选择性也小而且势力的妹子也不少。真感觉是围城。
出来混的迟早的滚回老家 at 2014年08月20日

#10 楼 @lgn21st 愿闻其翔 #11 楼 @blacktulip 一语中的 #12 楼 @billy rails 算是兴趣吧。准备在业余做做，没打算靠 rails 吃饭。
出来混的迟早的滚回老家 at 2014年08月20日

#6 楼 @chairy11 地狱模式挖墙脚中。基本自讨没趣。 #7 楼 @goinaction 谢谢提供情报。nlpjob 平时也会关注一下。可是没有工作经验看招聘条件有种雾里看花的感觉。 #8 楼 @Iacob 没想过一直这样生活。真心感觉粗不粗国就是一座围城。自己的话每天重复相同的事情肯定是会腻死。
出来混的迟早的滚回老家 at 2014年08月20日

#1 楼 @Iacob 内定的公司工作地点就是东京。 #3 楼 @iBachue 想做点自己喜欢做的事情。平时太寂寞。
问一个关于 ruby/rails 方向工作和考研的问题 at 2014年08月06日

硕二路过。喜欢 ruby 的话觉得可以当副业。主业还是自己研究生专攻的方向吧。
目前哪些基于 Solr 的分词器比较完善？ at 2014年06月27日

要动态加载的首先基于机器学习的一些工具自然是不怎么容易上手了。当然也没那么容易入手。至于几种常见的 lucene 切词工具 Paoding<ik<<<<<smartcn Paoding 词库基本已经没有更新，当然也没必要更新。最近的一次更新应该是兼容 solr.4xx 自定义词典什么的就是个普通的文本文件而已。不过每次修改之后需要重新封装。具体忘了。解决方法肯定是有的就是了
这个算是 bug 么 at 2014年06月05日

#1 楼 @kgen thanks。简单明了。
Ruby 的机器学习例子 at 2014年05月22日

ruby，python 这些之所以被称为胶水语言，在机器学习的实装方面也是，使用 ruby 仅仅是为了把几个用其他语言写成的模块拼凑起来。另外 ruby 处理字符串比较方便。我喜欢这点。真正纯 ruby 实现基本上是蛋疼。现在一些无监督的学习，我喜欢用 ruby 和 R 合体来搞。一些有监督的学习，比如序列标注，线性回归之类的，我习惯用现有的工具 + 自己写的 ruby 的 wrapper 来实现。
求一个相识度算法。 at 2014年04月17日

直接讲最简单的方法

step1. 中文分词

step2.构建单词 - 文档向量。比如说 text1(我们，都，码农……) text2(苹果，3 块钱，一斤…) 这种。

step3.对 2 中构建的向量使用聚类算法。比如 k-means 什么的。

建议直接看 k-means，具体实现可以用 R 也可以用 mahout 的库什么的。当然实装能力强的也可以自己写……

很多时候你认为这只是一个算法，其实特么算法才是最次要。
redcarpet render lalex 公式有什么好的解决方法？ at 2014年04月17日

感谢指点。问题已经解决。果断扔了 redcarpet 改用 kramdown。kramdown 把 latex 给 markup 起来了，调用 mathjax 的 api 把 render 的事情交给浏览器去做。

顺便测试一下 ruby-china 的公式编辑功能

$$ E=MC^2 $$
自制中文分词 gem at 2014年03月03日

#1 楼 @luikore 多谢指点。马上去研究研究
关于在 Windows 上运行本地命令的问题 - 之二 at 2014年02月14日
```
Dir.glob('F:/data/*.abc').{
    |abc| system ("C:/Program Files/WinRAR/WinRAR.exe a #{abc} #{abc}")
}
```
这样呢。|abc|是变量直接在单引号中使用显然会被当然普通字符串
关于在 Windows 上运行本地命令的问题 - 之二 at 2014年02月14日

改成用一个双引号括住全部？是不是单引号不转义的原因