高手就直接忽略吧。
需求描述:淘宝现在对 API 的调用权限貌似门槛比较高,一般用户不给商品基础信息调用,于是自己写了个。思路很简单,通过 Nokogiri 抓取 HTML,代码也写的很简单,其实写这个玩意也纯粹是想熟悉下如何去写一个 gem,以前都用人家写好的,觉得自己也有必要熟悉下。另附上写 gem 的基本方法:http://ruby-china.org/wiki/how_to_create_a_gem
功能描述:通过淘宝或天猫链接获取商品标题,价格,图片信息,完毕。
gem install bundler 之后,可以了。 是 bundler 的版本太旧了。
以前一直是 gem install bundle。不会升级 bundler
Use a Gemfile and bundler with your app,当 gem 有冲突的时候,然后在当前目录下 irb,就可以了,我的 ruby 版本是 1.9.3,2.0 我没测试
#32 楼 @wikimo http://dongxi.douban.com/show/create 可以看看这个的抓取,它难道也像我们这样从一个个网站页面上面抓取?
@assyer 谢谢你的建议,已经合并了你的代码并做了一些重构。但这个 gem 还是有些问题的,对于 http 302 的一些淘宝 url 是没办法抓取到信息的。因为 open url 的时候返回 302 了,这种情况还没做处理。 豆瓣东西我也研究过,我想它应该也是写了很多抓取规则。淘宝本身有 api 可用,但是现在门槛高了,不好使。京东这些本身也都开放了 api 了。