由于对于 Ruby-China 社区的喜爱,基于 TensorFlow 开发了一个端到端字符级的 Ruby China 招聘帖生成器 RecruitBot。
项目的 Github 地址为:https://github.com/CrawlScript/RecruitBot
可以访问http://datahref.com/api/demo/job_title_generator来在线生成招聘帖标题
用 RecruitBot 随机生成了几个招聘贴:
可以访问http://datahref.com/api/demo/job_title_generator来在线生成招聘帖标题
是不是可以以假乱真了(下图是真实的招聘帖标题):
算法在生成标题时,是一个字符一个字符生成的,换句话说,算法并不知道 Ruby 是一个单词,所以如果算法生成了 Ruby,它是依次生成 R、u、b、y 这四个字符的。
算法并没有使用任何规则,其实我们看到 Ruby China 的招聘信息有一定的规律,其实使用规则也可以生成,例如 [地区]+公司名 + 招聘 + 职位+x 名,这是传统的机器学习算法。端到端的算法不知道这些规则,在训练时只知道数据集中的标题字符串信息。