在试着用 Nokogiri 抓取一网页,代码类似下面。然后在调试中,发现 Nokogiri 抓取的页面内容与浏览器中显示的不一致。就是原网页通过 js 或者 ajax 加载至网页的一些内容 Nokogiri 抓不到,不知道大家是否碰到过这样的问题,以及如何解决掉的?
agent = Mechanize.new
agent.user_agent_alias = 'Mac Safari'
detail_page_url = 'http://www.example.com'
doc = Nokogiri::HTML.parse(agent.get(detail_page_url).body, nil, 'utf-8')