如上图,这张图片上好多杂质啊,不知道叫什么,要怎么识别这种图上的数字,纠结啊,不懂图形学。请指教。
noise
https://github.com/meh/ruby-tesseract-ocr
@mimosa 我用了一个 rtesseract 插件,识别不了这种有 noise 的图片,这个也是一样的么?
@huobazi 我看了下噪声有好多种啊,这种叫什么,要不找不到对应的算法。
#4 楼 @huyong36 噪点是随机产生的?知道了算法如何识别呢?!
@mimosa 嗯 随机生成的,应该有去噪算法吧,我在这方面是个盲。
处理成: 可以识别了。
#7 楼 @huyong36 调整对比度吗?
@mimosa 没有,用 rmagick 的 reduce_noise 去噪声,然后哪些杂质线的像素会变得很深,趋近与黑色,再把黑色像素全替换成白色像素。。。这是我想到的最笨的方法