Ruby rmmseg-cpp 分词的问题

Louis · 2013年01月23日 · 最后由 Louis 回复于 2013年01月23日 · 3618 次阅读

分词得到的词语的中文编码都是 ASCII 的。。不知道怎么转成 UTF-8 或者 GBK 我试过直接 encode..报错...GBK 和 UTF-8 都报错。但是可以把词语写进一个文件里再读出来，就可以得到想要的编码。可是这样做效率就低了。求教。。

luikore #0 2013年01月23日

word.force_encoding 'utf-8' ?

Louis #1 2013年01月23日

#1 楼 @luikore 行了。。我试了 force_encoding 'GBK' 忘了试 utf8 了。。谢谢。

需要登录后方可回复, 如果你还没有账号请注册新账号