想把这个网页(http://finance.sina.com.cn/oldnews/2012-03-09.html)上的新闻的链接都抓下来,编写如下程序
require 'mechanize' agent = Mechanize.new page = agent.get('http://finance.sina.com.cn/oldnews/2012-03-09.html')
page.links.each do |link| puts link.text end
运行之后出现 encoding error: input conversion failed due to input error,bytes 0xE9 0x46 0xBB 0xF9
程序会有输出,但是输出中只把这个页面中的一部分的链接抓了下来,只抓到这条新闻“2 月 CPI 同比上涨 3.2% PPI 与去年同月持平”,下面的就没有了。
求问大神们如果解决这个问题,谢谢!