Gem Nokogiri 获取 td 里面的内容 或者某个元素后面的内容

luffycn · 2014年10月07日 · 最后由 luojie2017 回复于 2016年12月22日 · 2882 次阅读

如果有这么一段 html

text

....

....

....

用这段代码 nodeset = content.css('td[@width="70%"]') data = nodeset[0].to_s

输出的 data 会包含有 td 标签本身 如何去掉 td 了

另外,如何获取 h3 标签后面的所有 p 内容了

用 xpath Nokogiri::HTML(html).xpath('//td').text Nokogiri::HTML(html).xpath('//td/h3').text Nokogiri::HTML(html).xpath('//td/p').text

inner_html

html = Nokogiri::HTML('<td width="70%"><h3>text</h3><p>....</p><p>....</p><p>....</p></td>')
puts html.css("td").children # 或inner_html
puts html.css("td p").text

请问:如何抓取当前页面的页面信息?

#3 楼 @xx_lee

需要 登录 后方可回复, 如果你还没有账号请 注册新账号