我现在用 Nokogiri 解析网址,获取 document。 优酷、新浪视频等视频 HTML 地址好抓取,但是土豆没有直接给出,不知道怎么办了。还有,视频缩略图怎么抓取? 有没有专门的 gem 啊?或者相关的算法也可以。本人新手,望指教。
土豆源码中包含
itemData={
iid: 65855680
,icode: '7IiLZmEbwpE'
}
然后
http://www.tudou.com/l/#{icode}/&iid=#{iid}/v.swf
就是视频地址
src="http://player.opengg.me/td.php/l/i67lCgQt5nQ/&resourceId=0_05_05_99&iid=154851918&bid=05/v.swf"
src="http://player.opengg.me/td.php/a/TssfnTcSU3Y/&resourceId=0_05_05_99&iid=155218901&bid=05/v.swf"
src="http://player.opengg.me/td.php/v/-bx9kB3SBO0/&resourceId=0_05_05_99&bid=05/v.swf"
这是三个视频的 src,acode 前面的几个字母不一样(l,a,v),不知道是什么?!还有 resourceId 是不是固定?!第三个视频没有 iid 也没有?!