如果有这么一段 html
....
用这段代码 nodeset = content.css('td[@width="70%"]') data = nodeset[0].to_s
输出的 data 会包含有 td 标签本身 如何去掉 td 了
另外,如何获取 h3 标签后面的所有 p 内容了
用 xpath Nokogiri::HTML(html).xpath('//td').text Nokogiri::HTML(html).xpath('//td/h3').text Nokogiri::HTML(html).xpath('//td/p').text
inner_html
html = Nokogiri::HTML('<td width="70%"><h3>text</h3><p>....</p><p>....</p><p>....</p></td>') puts html.css("td").children # 或inner_html puts html.css("td p").text
请问:如何抓取当前页面的页面信息?
#3 楼 @xx_lee