Gem 用户 Nokogiri 解析到乱码,我该写一个什么方法让以下内容不存入数据库?

freemem · 2012年05月01日 · 最后由 camel 回复于 2012年05月02日 · 3698 次阅读

假设此变量为:p.text

京东商城和中国亚马逊今日特价报¥1899包邮,历史低价,低于其他B2Cæ¸ é“è‡³å°‘ï¿¥2099以上的报价。注:此款目前已可以升级到android 4.0。

# encoding: utf-8

先用 iconv 转码。

#2 楼 @yangyanhao 网上搜索了下,貌似没有完美的。我现在没有转码,90% 的都没有问题,所以懒得折腾,希望简单化过滤掉就行。

假设 p.text 的编码是 utf8,这样应该就可以把无效字符清除掉:

Iconv.iconv("UTF-8//IGNORE", "UTF-8", p.text).join("")

需要 登录 后方可回复, 如果你还没有账号请 注册新账号