新手问题 Nokogiri 获取页面指定元素

answer · 2014年12月12日 · 最后由 luojie2017 回复于 2016年12月22日 · 2227 次阅读

现有如下标签:

<li label="profile"> Profile</li>
<li label="setting">Setting</li>
<li label="root">Root</li>
<li label="signup">Signup</li>
<li label="login">Login</li>
<li label="back">Back</li>

请问我如何通过 Nokorigi 的 css 或者是 xpath 方法获取到指定 label 内容的标签呢?(如获取 label = “root”的标签)

你可以用 google chrome,右键审查元素,然后再到下面

  • Root
  • 右键,可以选择 Copy CSS Path 或者 Copy Xpath

    #1 楼 @chiangdi 这不是程序员思维吧。。况且是用程序去找,不是人去找

    #2 楼 @answer 你写程序抓取网页里的内容,xpath 确实是要人找的。。比如你可以类似这样写 doc.xpath("//li[@lable='root']") 可以参考一下我以前写的 豆瓣小组图片采集器

    #3 楼 @chiangdi 恩,上面的方法可以

    @answer @chiangdi 能给全点的测试代码吗?

    #3 楼 @chiangdi 请问:如何抓取当前页面的页面信息内容?

    需要 登录 后方可回复, 如果你还没有账号请 注册新账号