Gem 用户 Nokogiri 解析到乱码,我该写一个什么方法让以下内容不存入数据库?

freemem · May 01, 2012 · Last by camel replied at May 02, 2012 · 3698 hits

假设此变量为:p.text

京东商城和中国亚马逊今日特价报¥1899包邮,历史低价,低于其他B2Cæ¸ é“è‡³å°‘ï¿¥2099以上的报价。注:此款目前已可以升级到android 4.0。

# encoding: utf-8

先用 iconv 转码。

#2 楼 @yangyanhao 网上搜索了下,貌似没有完美的。我现在没有转码,90% 的都没有问题,所以懒得折腾,希望简单化过滤掉就行。

假设 p.text 的编码是 utf8,这样应该就可以把无效字符清除掉:

Iconv.iconv("UTF-8//IGNORE", "UTF-8", p.text).join("")

You need to Sign in before reply, if you don't have an account, please Sign up first.