gem install cseg
使用之前须下载并安装 CRF++。(http://crfpp.googlecode.com/svn/trunk/doc/index.html)
使用 MIRA 学习了大量的素性。
require 'cseg'
result=Kurumi.segment(str)
结果以数组保存。
94.43%
92.86%
tested on seghan 05 pku test set
源码是 https://github.com/lengshuiyulangcn/kurumi 么?
看来很靠谱的样子,不过有几点可以改进下:
result_data = IO.popen %w'crf_test -m pkumodle.data', 'r+' do |io| io.puts *str.chars io.close_write io.read end
#1 楼 @luikore 多谢指点。马上去研究研究