类似现在豆瓣的东西 根据商品链接,能把商品的图片抓取下来
我试了一下,不知道淘宝是否做了屏蔽……?好像不行
desc "Fetch sites"
task :fetch_taobao => :environment do
require 'nokogiri'
require 'open-uri'
url = "http://item.taobao.com/item.htm?spm=a1z09.5.0.0.g7OprK&id=26352216965"
doc = Nokogiri::HTML(open(url))
puts doc.css("title").text
puts doc.css("img")[0]['src']
puts doc.css("img#J_ImgBooth")[0]['src']
end
第1个img能抓到。但是后面的商品图片img#J_ImgBooth就不行了……