开源项目 Nokogiri 能否获得某个网页元素在网页源码中的字符位置？

rubysir · May 26, 2016 · 1778 hits

比如：第一个 p 标签：p_tag = web_doc.xpath('//p').to_a.first 那个怎么得到这个 p 标签的 outerhtml 字符串在整个 html 源码中的 index 呢？如果首先得到 p 标签的 outerhtml，然后使用（html_source 为网页源码）：html_source.index(P_outerhtml) 这样得到的结果未必准确，因为可以含有多个 p 标签（p 标签的 outerhtml 也相同）。实际上我想知道，在 nokogiri 使用中，有没有方法在 p 标签对象和 p 标签的 outerhtml 在网页源码中的位置之间，建立一个双向互动的关系。比如：给定网页源码中的某个字符串的位置，就可以知道该位置处的标签是什么。多谢！

No Reply at the moment.

You need to Sign in before reply, if you don't have an account, please Sign up first.