找不到什么好的方法可以取得一个含有类似下面 javascript 的页面!
比方有个页面里有如下一些内容:
ppp<a style="" class="ab" href="javascript:;">更多</a>qqq
点击这个链接会出现更多的读者,或者其他的东西在本网页中
如何用 ruby 抓取呢? 求教!谢谢!
@Perish 一般会在 js 事件中绑定,所以还需要看看其他 js。至少取链接,如果是 js 中的,直接使用正则表达式即可,如果是在 html 中,建议使用 nokogiri: http://nokogiri.org 复杂一些的抓取,推荐使用 patron。这里有一个我以前写过的 demo: http://github.com/windy/pcapr 你可以作参考。
要获取他页面上 ajax 动态加载的内容吧,你点一下那个“更多”,查看 firebug 中出现的请求链接(以及他的参数啊,返回的结果之类的信息),写个方法 get 请求这个链接,然后解析 response