Ruby 有没有完美一点的方法来 parse url？URI.extract 遇到冒号就傻了

cqpx · 2012年01月10日 · 最后由 cqpx 回复于 2012年02月04日 · 5678 次阅读

ruby-1.9.3-p0 :007 > URI.extract("haha http://google.com, Active::Record, jquery.js:")
 => ["http://google.com", "Active::Record,", "jquery.js:"]

自己写正则呢，一个是本来正则就不太熟悉，二个是怕考虑不全面，ruby-china 解析 url 的办法也有问题。

请问有没有完美一点的 url 解析办法？

谢谢

5 个赞

lgn21st #0 2012年01月10日

我们的项目中也遇到这个问题，我们的方法是参照 Twitter 的做法，Twitter 有个开源项目叫做 twitter-text-rb https://github.com/twitter/twitter-text-rb

里面有个 autolink 方法，考虑的比较全面，也附有测试用例，你试试看提取这个 autolink 的实现是否符合你的需求：https://github.com/twitter/twitter-text-rb/blob/master/lib/autolink.rb

cqpx #1 2012年01月10日

#1 楼 @lgn21st 多谢大哥指点，找到了满意的方案具体来讲就是用https://github.com/twitter/twitter-text-rb/blob/master/lib/regex.rb里面的Twitter::Regex::REGEXEN[:valid_url]

需要登录后方可回复, 如果你还没有账号请注册新账号