require 'similar_text' item1 = '相宜本草INOHERN 日夜润白精华霜(日霜+晚霜)50g*2' item2 = '相宜本草日夜润白精华霜(日霜+晚霜)50g*2' item1.similar(item2) # => 90.47619047619048 item1.similar_chars(item2) # => 38
对比两句话的相似度。
phash 算法还可以计算非文本的相似度: http://rubylution.herokuapp.com/topics/15
这个算法就是太慢了