Gem 发现一个 clone PHP similar_text 的组件。

mimosa · 2012年10月23日 · 最后由 itlodge 回复于 2016年01月06日 · 2923 次阅读
require 'similar_text'

item1 = '相宜本草INOHERN 日夜润白精华霜(日霜+晚霜)50g*2'
item2 = '相宜本草日夜润白精华霜(日霜+晚霜)50g*2'
item1.similar(item2)
 # => 90.47619047619048
item1.similar_chars(item2)
 # => 38

对比两句话的相似度。

phash 算法还可以计算非文本的相似度: http://rubylution.herokuapp.com/topics/15

这个算法就是太慢了

需要 登录 后方可回复, 如果你还没有账号请 注册新账号