<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0">
  <channel>
    <title>ma_fan</title>
    <link>https://ruby-china.org/ma_fan</link>
    <description></description>
    <language>en-us</language>
    <item>
      <title>一个拖延了一年多的问题</title>
      <description>&lt;h3 id="举例描述"&gt;举例描述&lt;/h3&gt;
&lt;p&gt;一篇文章如下：&lt;/p&gt;

&lt;p&gt;四季
草芽尖尖，他对小鸟说：“我是春天。”荷叶圆圆，他对青蛙说：“我是夏天。”谷穗弯弯，他鞠着躬说：“我是秋天。”雪人大肚子一挺，他顽皮地说：“我就是冬天。”&lt;/p&gt;

&lt;p&gt;第一步操作：把里面的文字切成单字，并统计出现的次数：&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;四 1；2. 季 1，3. 草 1，4. 芽 1，5. 小 1，6. 鸟 1，7. 春 1，8. 荷 1，9. 叶 1，10. 青 1，11. 蛙 1，12. 夏 1，13. 谷 1，14. 穗 1，15. 鞠 1，16. 着 1，17. 躬 1，18. 秋 1，19. 雪 1，20. 人 1，21. 大 1，22. 肚 1，23. 子 1，24. 一 1，25. 挺 1，26. 顽 1，27. 皮 1，28. 地 1，29. 就 1，30. 冬 1，31. 尖 2，32. 对 2，33. 圆 2，34. 弯 2，35. 他 4，36. 说 4，37. 我 4，38. 是 4，39. 天 4&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;第二部操作：接下来统计每个字出现的次数、出现的位置之和，经过排序，可以得出一个字序表：&lt;/p&gt;

&lt;ol&gt;
&lt;li&gt;他；2. 说；3. 我；4. 是；5. 天；6. 尖；7. 对；8. 圆；9. 弯；10. 四；11. 季；12. 草；13. 芽；14. 小；15. 鸟；16. 春；17. 荷；18. 叶；19. 青；20. 蛙；21. 夏；22. 谷；23. 穗；24. 鞠；25. 着；26. 躬；27. 秋；28. 雪；29. 人；30. 大；31. 肚；32. 子；33. 一；34. 挺；35. 顽；36. 皮；37. 地；38. 就；39. 冬；&lt;/li&gt;
&lt;/ol&gt;
&lt;h3 id="纠结出现"&gt;纠结出现&lt;/h3&gt;
&lt;p&gt;问题正是这个字序表：所有的次数差异和位置差异，都被简化了。&lt;/p&gt;

&lt;p&gt;所以需要取消排序。可是如果取消排序，该怎么表达字间的差异呢？&lt;/p&gt;

&lt;p&gt;次数差异可以用 Z 分数表示，&lt;/p&gt;

&lt;p&gt;位置差异呢？应该用什么数字来表示呢？&lt;/p&gt;

&lt;p&gt;有什么方法可以次数差异和位置差异统一起来，用一个数字来表达呢？&lt;/p&gt;

&lt;p&gt;最后，有没有什么 gem 好处理这种问题呢？&lt;/p&gt;

&lt;p&gt;问到这个程度，真觉得自己有些猥琐了 :) 大家不要见怪。&lt;/p&gt;</description>
      <author>ma_fan</author>
      <pubDate>Fri, 17 Nov 2017 10:36:55 +0800</pubDate>
      <link>https://ruby-china.org/topics/34583</link>
      <guid>https://ruby-china.org/topics/34583</guid>
    </item>
  </channel>
</rss>
