目的:想要去网站中抓取数据,但是需要登陆,在登陆的表单中需要填写验证码。 问题:怎样获取验证码的值,实现自动填写验证码
我用的 gem 'rtesseract'
需要先安装 tesseract 基础库 这个库识别京东价格那样的图片无压力 不太复杂的验证码(混淆比较少的)也不在话下 示例:
Timeout::timeout(30) do
t = RTesseract.new
t.from_blob @agent.get(url: @url).body
@captcha = t.to_s_without_spaces
end