Ruby 将特定网页结点与对应 CSS 一同抓取

deathking · 2014年02月08日 · 最后由 coderek 回复于 2014年02月09日 · 2195 次阅读

现在有个比较特别地需求,假设我要抓取网页中的一个特定结点,比如id="content"div吧,我想连同它对应的CSS规则也一同抓取下来。现在的想法是,先用nokogiri抓取DOM Tree,然后用css_parser读里面的CSS文件,自己再做一个match。但这样做开销似乎太大了,所以想通过操作WebKit来取出RenderTree。

有更好地办法么?

共收到 3 条回复

试试 window.getMatchedCSSRules

#1楼 @Kabie 如果一定要用Ruby抓呢?

需要 登录 后方可回复, 如果你还没有账号请点击这里 注册