基于 Sinatra 和 Mechanize,暂时只是一个简单的页面代理. 看论坛有些新人问些采集的问题,希望此应用有所帮助. 代码量大概 150 行,无测试代码 github: https://github.com/mangege/hncsd
把表单隐藏字段与验证码给抓取过来后在页面上显示,提交表单到远程并解析返回结果. 具体看效果 原始页面:http://www.hncsjj.gov.cn/QueryJDCWZOther.aspx 代理页面 (部署在暂时免费的盛大云引擎): http://hncsd.sdapp.cn/