如题,谢谢~
有 libsvm 的包装:https://github.com/febeling/rb-libsvm (可惜不是增量的) 朴素贝叶斯网络 classifier https://rubygems.org/gems/classifier (貌似有人说内存吃得挺大), 但是自己实现一个贝叶斯网络是很简单的,例如 github 的语言检测:https://github.com/github/linguist/blob/master/lib/linguist/classifier.rb rmmseg 是基于比较老的 mmseg 的分词工具 基于 viterbi 的分词工具 mecab 有 ruby binding (算法和中科院 ictclas 差不多的) https://github.com/rsl/stringex 有个表可以用来查找 unicode 字符名称
stochasitic gradient descendent 的 ruby 工具好像还没见过
#1 楼 @luikore 谢谢你哈!
搞这些建议不要用 ruby 了 python 的很齐全
#3 楼 @aisensiy 是啊是啊 我用的就是 python 谢谢哈