请教各位,导入 csv 出错 invalid byte sequence in utf-8,文件是用 office2010 转的,用 force_encoding 转成其他编码可以导入但是乱码,这个要怎么处理啊?
office2010 的文件一般是 gbk 的吧? gbk_to_utf8 试试,或者看这个 http://rubyeye.herokuapp.com/articles/28-ruby1-9%E4%B9%8B%E5%AD%97%E7%AC%A6%E4%B8%B2%E5%86%85%E7%BC%96%E7%A0%81%E5%92%8C%E5%A4%96%E7%BC%96%E7%A0%81
中文最全的库应该是 GB18030, GBK 并不全 在 shell 中 iconv -f 18030 -t utf8//IGNORE from > to 能解决大多数问题
#1 楼 @sevk 谢谢,刚刚试出来了,把 GBK 转 utf-8 可以了
#3 楼 @dxwts 这种问题最恶心了 有的时候不知道来源 只能一个一个试了
#4 楼 @zj0713001 一般就是 GB 的 , GB18030 兼容 GBK 和 GB2312