这个主题比较有意思。参考我的微博:http://weibo.com/1234692487/ycaHZ11cs#1336117181569
已解决,EOFError,使用 open(url) 时,可能由于超时获其他什么原因,导致文档未取回,在解析时出错。用 rescue 捕捉错误并重试就好了。
#1 楼 @chinacheng 解决了,应该是 xml lib 库的问题。升级了 libxml2 就好了。
#4 楼 @yangyanhao thx,我试试
#5 楼 @clearJiang 恐怕我找到办法了: 一个正则表达式,只含有汉字、数字、字母、下划线不能以下划线开头和结尾: ^(?!)(?!.*?$)[a-zA-Z0-9_\u4e00-\u9fa5]+$
#2 楼 @yangyanhao 网上搜索了下,貌似没有完美的。我现在没有转码,90% 的都没有问题,所以懒得折腾,希望简单化过滤掉就行。
大伙有空看看我的这个贴吧,急着要解决此问题:http://ruby-china.org/topics/3011
#5 楼 @clearJiang 用了,用这上能通过。我估计是 ruby1.8.7 不认区间里的区间。即 [ [ ] ] 这种形式
貌似还是不对,()[] 没有反斜杠了
好吧,是这个的: "[[\u4e00-\u9fa5],.\;\?\$''""-()[],.;?¥·,()[]\w]{70,}"
貌似 ruby-china 把我的字符中的某些内容过滤掉了。。。
@ywjno 谢谢,有空我再看看。
@ywjno 会提示没有 pagination 这个方法。
mark.