Ruby 将特定网页结点与对应 CSS 一同抓取

deathking · 2014年02月08日 · 最后由 coderek 回复于 2014年02月09日 · 2294 次阅读

现在有个比较特别地需求,假设我要抓取网页中的一个特定结点,比如id="content"div吧,我想连同它对应的 CSS 规则也一同抓取下来。现在的想法是,先用nokogiri抓取 DOM Tree,然后用css_parser读里面的 CSS 文件,自己再做一个 match。但这样做开销似乎太大了,所以想通过操作 WebKit 来取出 RenderTree。

有更好地办法么?

共收到 3 条回复

试试 window.getMatchedCSSRules

#1 楼 @Kabie 如果一定要用 Ruby 抓呢?

需要 登录 后方可回复, 如果你还没有账号请点击这里 注册