新手问题 Nokogiri 获取页面指定元素

answer · 2014年12月12日 · 最后由 luojie2017 回复于 2016年12月22日 · 2255 次阅读

现有如下标签：

<li label="profile"> Profile</li>
<li label="setting">Setting</li>
<li label="root">Root</li>
<li label="signup">Signup</li>
<li label="login">Login</li>
<li label="back">Back</li>

请问我如何通过 Nokorigi 的 css 或者是 xpath 方法获取到指定 label 内容的标签呢？（如获取 label = “root”的标签）

chiangdi #0 2014年12月12日

你可以用 google chrome，右键审查元素，然后再到下面

Root

右键，可以选择 Copy CSS Path 或者 Copy Xpath

1 个赞

answer #1 2014年12月12日

#1 楼 @chiangdi 这不是程序员思维吧。。况且是用程序去找，不是人去找

chiangdi #2 2014年12月12日

#2 楼 @answer 你写程序抓取网页里的内容，xpath 确实是要人找的。。比如你可以类似这样写 doc.xpath("//li[@lable='root']") 可以参考一下我以前写的豆瓣小组图片采集器

answer #3 2014年12月12日

#3 楼 @chiangdi 恩，上面的方法可以

luojie2017 #4 2016年12月22日

@answer @chiangdi 能给全点的测试代码吗？

luojie2017 #5 2016年12月22日

#3 楼 @chiangdi 请问：如何抓取当前页面的页面信息内容？

需要登录后方可回复, 如果你还没有账号请注册新账号