• #7 楼 @crazyjin heroku 没法部署 erlang 代码 否则我也会部署上去的

  • #7 楼 @crazyjin 这个是聊天室?聊天室简单的用 rails 就可以搭,为啥用 elixir。聊天室和 im 还是有区别的,首先聊天室的在线数最多 1000 就到头了,你见过几千人的聊天室么?发送的消息都看不过来。IM 起码要支持的用户数都是以万为单位的,erlang 的做法是每个用户链接都有 1 个或者几个进程去处理。这样随随便便进程数就在十万级或者百万级的范围了,这时进程的通信,进程的查找都是需要解决的问题,这些问题对聊天室来说完全不存在。聊天室的逻辑就是我把每个消息都推送给每个在线的人,而 IM 呢,我要考虑接收消息方不在线的情况,我要存离线,不管用什么存,我都要有个链接池来管理数据库的链接。链接池很好做,但是稳定容错性能高的连接池就要考虑很多东西。

  • #4 楼 @luikore 恩 这是我疏忽 居然忘了给消息加时间。Thanks

  • #3 楼 @yakczh 不一样 github 上有消息结构

  • 这个图还是发在这安全点啊

  • 怎么群发的邮件???

  • 难道你们还没学 Erlang ? at 2014年12月03日
    <<1:8/binary>>.
    

    这种写法为什么是错的呢?

    <<1:8/unit:8>>
    

    这种为什么就没问题?

  • 关于 csrf 的问题 at 2014年12月03日

    你的 get 请求就能获取 csrftoken 那么这个令牌还有啥用,谁都可以请求了令牌再发请求了。。完全失去了这个令牌的存在意义。。

  • 别用 raw 和 html_safe at 2014年09月23日

    #42 楼 @lonely21475 唉 同学 你进来了吗?

  • 关于网页抓取的学习历程 at 2014年08月29日

    #30 楼 @lanyatou 这个东西也不好用 还是用 watir 吧,我发现这个有简单,但是就是慢点。。

  • 关于网页抓取的学习历程 at 2014年08月28日

    #26 楼 @lanyatou cookie 我是这么导出来的:

    document.cookie
    
  • 关于网页抓取的学习历程 at 2014年08月28日

    #26 楼 @lanyatou 我是这么写的:

    require mechanize
    baidu_agent = Mechanize.new
    baidu_agent.cookie_jar.load_cookiestxt("cookies/baidu.cookies")
    url = 'http://www.baidu.com'
    home_page = baidu_agent.get(url)
    

    结果还不是登录的状态,你帮我看看。

  • #22 楼 @lanyatou 又是你,你们公司到底在做什么阿?

  • 关于网页抓取的学习历程 at 2014年08月28日

    #26 楼 @lanyatou 还是别用这种方式了,你看看用 mechanize 然后导入登录后的 cookie 这种方式呢,又简单抓取速度又快,我实在是被 casperjs 搞的精疲力尽,高潮迭起,快不行了。。。。。

  • #22 楼 @lanyatou 还是 Cookie 复用这种方式最简单,别去管什么 form 登录了,像百度的 form 就是 javascript 生成的,你怎么办,非要分析 js 么,人家一改你又完了。

  • 关于网页抓取的学习历程 at 2014年08月27日

    是我没读懂么,怎么感觉这东西登录用起来好费劲阿。。。难道就没有完全能模拟浏览器行为的东西????

  • 关于网页抓取的学习历程 at 2014年08月27日

    #21 楼 @lanyatou 妈的,感觉这东西该停的地方停不下来。是我没玩明白????

  • 关于网页抓取的学习历程 at 2014年08月27日

    #21 楼 @lanyatou 我改了一下 你再看一下,但是还是不通。。。(在原来的楼层改的)

    [debug] [phantom] Navigation requested: url=https://passport.baidu.com/v2/api/?login, type=FormSubmitted, lock=true, isMainFrame=false
    [debug] [phantom] Navigation requested: url=http://index.baidu.com/static/v3Jump.htm?err_no=257&callback=parent.bd__pcbs__88fo40&codeString=captchaservice326564385963637844715a746b666a38763834672f4b703573355445436d57782b335074715053416b7157644b5855425134615863686f396775542f394667564242657251796b42335839302b6b4e326e50346a67472f716d624d534c513277564f614a35686e52672f4362312f305564696a53646f525a737155314230455565786c76396d544942723946466f34642b46782b61544d6c6673786f32417a4246736d3851714a54484b516669474a6b6475776538757a594533765633337538494769384d573879694b7a696a39486d6e714e716c63776f746e7635566d3634534d75585a7a6d4569337350754e4134494c6b6d41325169496e4931587a6b6f796a3065756754784d2b59576150396d797670414f6b6c626239574f6b4b4f6c73334f637338546132506276672b704f3968705273734d524374506e3977&userName=wudixiaotie&phoneNumber=&mail=&hao123Param=&u=http://index.baidu.com/&tpl=&secstate=&gotourl=&authtoken=&loginproxy=&resetpwd=&vcodetype=e61fcWmwhK7ZyIfWHlY+iHSmF7wcgyMjJBa+ZAChAh+2PAinQDnh3OrZ7OyH6WRIJGFdHbfaE5WylnEvy5P8hJowSJs&lstr=&ltoken=&bckv=&bcsync=&bcchecksum=&bctime=&accounts=, type=Other, lock=true, isMainFrame=false
    
  • 关于网页抓取的学习历程 at 2014年08月27日

    #21 楼 @lanyatou 你这个 verify code 不是加密的事,是验证码。。。。你没输入验证码

  • 关于网页抓取的学习历程 at 2014年08月27日

    #19 楼 @lanyatou 这是我的代码:

    var casper = require('casper').create({
        verbose: true,
        logLevel: "debug",
        clientScripts: ["includes/jquery-2.1.1.min.js"]
      })
      .userAgent("Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/36.0.1985.143 Safari/537.36");
    
    baidu_index_url = 'http://index.baidu.com/'
    
    casper.start(baidu_index_url, function() {
      this.evaluate(function() {
        BID.popLogin();
      });
    });
    
    casper.then(function() {
      this.evaluate(function() {
        $('input[name="userName"]').val("xxx");
        $('input[name="password"]').val("xxx");
        $('input#TANGRAM_18__submit').click();
      });
    });
    
    casper.waitForSelector("#ubarUname", function() {
      this.capture('current_page_capture.png');
    }, 10000);
    
    casper.run();
    

    改了一下 还是不行 但是确实是登录了 跳转到一个 url 就不通了。。。。

  • 关于网页抓取的学习历程 at 2014年08月26日

    #15 楼 @lanyatou 我试试把,没弄过百度的登录

  • 关于网页抓取的学习历程 at 2014年08月26日

    #15 楼 @lanyatou 指的是登录百度么???

  • 关于网页抓取的学习历程 at 2014年08月26日

    #13 楼 @lanyatou 遇到过就是 input 输入的是点点的那种密码输入,用 casperjs 能成功登陆。。

  • 关于网页抓取的学习历程 at 2014年08月22日

    casperjs 最有意思的一个功能就是能对当前页面进行截图,不错的一个小功能。

  • #19 楼 @hz_qiuyuanxin 我的并发是 3 阿,也会经常不见了,倒是 max_threads 是 1 这个有影响么

  • #19 楼 @hz_qiuyuanxin 3.1.4 应该是最近的版本,因为是新项目。不过以下是我的设置,您看可以给个建议到底是哪里的毛病么?:

    :concurrency: 3
    :max_threads: 1
    :logfile: log/sidekiq.log
    :pidfile: tmp/pids/sidekiq.pid
    staging:
      :concurrency: 3
    production:
      :concurrency: 3
      :max_threads: 1
    

    运行 sidekiq 的命令是:nohup bundle exec sidekiq -d -e production -l log/sidekiq.log &

  • #12 楼 @baypm2014 那你英语水平有待提高阿,不过你不用描述阿,只要搜索关键词就好了,我从来没在上面提过问题。。。。