#3 楼 @xiaogui 其实可以用一些像 selenium 一样的东东来像浏览器一样 run js,而不用自己去解析 js 中的 ajax。社区里黄亿华先生写的通用爬虫 https://github.com/code4craft/webmagic
#2 楼 @danielpowter 欢迎学长常回来看看~
#8 楼 @showlovel 只是修辞的话会不一样,但是信息好像一样的。
要做一个新功能可以先 mockup 一下,这样子你会对需求理解的更清楚,而且会可视化的明确下一步要干什么,target 有了再开始实现 function。
#22 楼 @u1360749170 四野之内,六合之间,必是我党笑傲江湖~
ruby2.0 没有问题。。。ruby1.9 不晓得是不是因为楼主的编辑器字符集不是 UTF-8。导致打出的路径本来就不是 utf-8 编码。所以解析错误。我在 windows 下试过,没有这个问题。
#17 楼 @u1371780084 帖子更新了,您关心的性能问题,可以看一下。
#15 楼 @u1371780084 分词速度单机 996KB/s,分词精度 98.45%,