算法 [深度学习] 开源项目 RecruitBot,自动生成 Ruby China 招聘帖 (基于 TensorFlow)

AI_DEV · 2019年08月23日 · 最后由 embbnux 回复于 2019年10月25日 · 3059 次阅读
本帖已被设为精华帖!

开源项目RecruitBot

由于对于Ruby-China社区的喜爱,基于TensorFlow开发了一个端到端字符级的Ruby China招聘帖生成器RecruitBot。

项目的Github地址为:https://github.com/CrawlScript/RecruitBot

测试API

可以访问http://datahref.com/api/demo/job_title_generator来在线生成招聘帖标题

招聘贴生成

用RecruitBot随机生成了几个招聘贴:

  • [成都] 瑞小博科技有限公司招聘 Rails 程序员 1 名
  • [上海] 全位信息技术 (上海) 有限公司招聘前端工程师 15-30K
  • [杭州] Rails 后端工程师 3 名 (15K-20K)
  • [深圳] 阿里巴巴 O2O 公司招聘 Ruby 开发工程师
  • [北京] iClick 急聘 Ruby 开发工程师
  • [北京] D 轮融资互联网公司招聘 Ruby 工程师
  • [深圳] 招聘啦,求 Sketchup Ruby 二次开发的人才
  • [北京] 动吧体育招聘 ruby 工程师
  • [北京][东直门] 简单心理招聘 Ruby 工程师一名 (15 ~ 23k)

可以访问http://datahref.com/api/demo/job_title_generator来在线生成招聘帖标题

是不是可以以假乱真了(下图是真实的招聘帖标题):

什么是字符级?

算法在生成标题时,是一个字符一个字符生成的,换句话说,算法并不知道Ruby是一个单词,所以如果算法生成了Ruby,它是依次生成R、u、b、y这四个字符的。

什么是端到端?

算法并没有使用任何规则,其实我们看到Ruby China的招聘信息有一定的规律,其实使用规则也可以生成,例如[地区]+公司名+招聘+职位+x名,这是传统的机器学习算法。端到端的算法不知道这些规则,在训练时只知道数据集中的标题字符串信息。

共收到 15 条回复
jasl 将本帖设为了精华贴 08月23日 10:43

机器学习能自动写小说吗? 太长的可能不行, 弄个短篇啥的

jasl 回复

谢谢

liuminhan 回复

可以的,目前这个模型我是希望大家都可以在自己PC机上跑起来,所以弄了个最简单的模型了。

AI_DEV [机器学习] Ruby China 招聘帖自动生成 API 中提及了此贴 08月23日 12:49

端到端字符级写ruby代码的来一个

[广州] 中关村] ware Software 招聘 Ruby/Ruby 程序员,已结束 (我们寻 😂

是不是过拟合了?生成了好几个和rubychina上几乎一模一样的招聘标题

matsuijurina 回复

肯定会有的

大家让一让,我有阿里云华为云腾讯云的服务器,目前可以送华为云一个月的使用,有需要V我aliyun-cz

这个训练模型用了多长时间训练,训练成本需要多少

看起来是基于 LSTM, 可以试试 Transformer 效果会更好,也不用担心字符串长度。 最近做了这个小程序,用 Transformer 来生成古诗和宋词,可以玩玩: 小诗一首

需要 登录 后方可回复, 如果你还没有账号请点击这里 注册