Ruby rmmseg-cpp 分词的问题

Louis · 2013年01月23日 · 最后由 Louis 回复于 2013年01月23日 · 3575 次阅读

分词得到的词语的中文编码都是 ASCII 的。。 不知道怎么转成 UTF-8 或者 GBK 我试过直接 encode..报错...GBK 和 UTF-8 都报错。 但是可以把词语写进一个文件里再读出来,就可以得到想要的编码。可是这样做效率就低了。 求教。。

word.force_encoding 'utf-8' ?

#1 楼 @luikore 行了。。 我试了 force_encoding 'GBK' 忘了试 utf8 了。。 谢谢。

需要 登录 后方可回复, 如果你还没有账号请 注册新账号