现在有个比较特别地需求,假设我要抓取网页中的一个特定结点,比如id="content"的div吧,我想连同它对应的 CSS 规则也一同抓取下来。现在的想法是,先用nokogiri抓取 DOM Tree,然后用css_parser读里面的 CSS 文件,自己再做一个 match。但这样做开销似乎太大了,所以想通过操作 WebKit 来取出 RenderTree。
id="content"
div
nokogiri
css_parser
有更好地办法么?
试试 window.getMatchedCSSRules
window.getMatchedCSSRules
#1 楼 @Kabie 如果一定要用 Ruby 抓呢?
试试 phantomjs? http://phantomjs.org https://github.com/colszowka/phantomjs-gem