Ruby 将特定网页结点与对应 CSS 一同抓取

deathking · February 08, 2014 · Last by coderek replied at February 09, 2014 · 2667 hits

现在有个比较特别地需求,假设我要抓取网页中的一个特定结点,比如id="content"div吧,我想连同它对应的 CSS 规则也一同抓取下来。现在的想法是,先用nokogiri抓取 DOM Tree,然后用css_parser读里面的 CSS 文件,自己再做一个 match。但这样做开销似乎太大了,所以想通过操作 WebKit 来取出 RenderTree。

有更好地办法么?

试试 window.getMatchedCSSRules

#1 楼 @Kabie 如果一定要用 Ruby 抓呢?

You need to Sign in before reply, if you don't have an account, please Sign up first.