<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0">
  <channel>
    <title>jy01264313 (jy01264313)</title>
    <link>https://ruby-china.org/jy01264313</link>
    <description/>
    <language>en-us</language>
    <item>
      <title>[北京] 知名券商寻找数据攻城狮</title>
      <description>&lt;p&gt;职位描述：&lt;/p&gt;

&lt;p&gt;1、参与核心爬虫系统架构设计、数据库设计；
2、参与各种核心搜索策略、算法、数据聚类、重组的设计与开发；
3、熟悉搜索引擎/spider 原理，对互联网页面的抓取质量负责；
4、通过大数据的方式来做金融行业分析，参与数据分析及模型建立。&lt;/p&gt;

&lt;p&gt;职位要求：&lt;/p&gt;

&lt;p&gt;1、2 年以上 Python、Ruby 开发经验，熟悉常用的信息抓取策略和数据重组算法，熟悉正则表达式；
2、精通信息抓取和整合技术，从结构化的和非结构化的数据中获取信息，掌握正则表达式；
3、精通与搜索和个性化相关的机器学习算法，分类和提取摘要，精通主流分词算法；
4、熟悉大规模网页爬取，深度网页爬取，熟悉 Nutch、Lucene、Heritrix、Solr、Sphinx 等工具优先考虑；
5、熟悉搜索引擎的工作原理，对 seo 有较为深刻的理解；
6、熟悉分布式计算或高性能并行计算原理者优先；
7、有数据挖掘、机器学习相关经历者优先。&lt;/p&gt;

&lt;p&gt;加入我们请将简历发送至 lisg@guosen.com.cn&lt;/p&gt;</description>
      <author>jy01264313</author>
      <pubDate>Mon, 25 Aug 2014 09:49:20 +0800</pubDate>
      <link>https://ruby-china.org/topics/21208</link>
      <guid>https://ruby-china.org/topics/21208</guid>
    </item>
  </channel>
</rss>
