我报名技术演讲《统计分析与黑暗骑士》,主要是关于中型互联网公司内部的数据统计分析,想和大家分享和交流数据处理方面的经验技巧,幻灯片见 http://a.eoe.cn/presentations/statistics_analytics_and_dark_knight
另外顺便做个广告,近期公司准备针对 eoeAndroid 开发者社区做方便移动开发者的问答和代码库等相关服务,现招聘偏向前端的一两年以上经验的 Rails 开发者两三名,具体情况我们可以面谈:)
如果数据量比较少的,可以直接在在内存里 Iconv.new("GBK", "utf-8") 排下序就 OK 了
#1 楼 @blackanger 哈哈,很有参考意见~ 1,恩,一直是这么做的 2,一般不用商业闭源的软件,技术选型也不用 Hadoop 等 Java 系列的。目前都是开 screen 直接在测试服务器开发调试,稳定后才正式部署。各个功能还是相对独立,没有太多逻辑层次交互。
@fredwu 我要订购你这两款!
直接给 Bill, line_items, product 建个 log 表,最简单粗暴!
一种比较山寨不过还算不错的做法是,可以用 tf-idf 抽取下关键词,然后用 sphinx 搜索匹配相关性,加上分类或标签的过滤效果会更好。Ruby China 帖子一年也估计不过万来篇吧,最多半小时就能把相关性帖子重新索引预计算一遍。
社区里收到的简历靠谱多了,已有两位功底不错的童鞋确认入职,该职位继续有效!
highcharts 这个 js 的 ruby 库除了 lazy_high_charts 外,还有稍微高级一点的封装 https://github.com/drpentode/pie-high Raphael.js 也有一个 https://github.com/chubas/rafa
两个我都准备试用,有经验的人分享分享~
不错~
我的经历是 shell -> rails -> ruby -> rails -> 。。。,没有其他语言经历的当时连 MVC 也搞不懂= =||
写 Ruby 代码必用
class Object
# returns instance methods of current object's class and its singleton methods
def lm # abbr of local methods
self.methods.sort - self.class.superclass.instance_methods
end
end
一般不听,但是特别复杂的需要很集中精力的才听古尔德,霍洛维茨等人的钢琴。
在 plugin 根目录的 init.rb 里 require 'ruby-debug'; debugger 看看呗,么么
#1 楼 @night_song git grep keyword | ack keyword 这样就可以支持多条件过滤和高亮特定关键词了,哈哈
~ $ which ggit
ggit () {
grep $1 -rn . | grep -v git | less
}
#11 楼 @aNdReW_Qx 可能我表述的“关联键”不是很准确,我指的一个用来表述比如 blog 和 comment 之间关系的键。具体见上面我发的那个外国人写的数据库实际存储图。
@aNdReW_Qx @rockliu 关于原理和应用场景说的很明白了,我再补充一个其实 reference 和 embed 之间的区别就是把关联键的位置换了一下,实际在数据库的存储见 http://joeloliveira.com/2010/10/23/visualizing-the-difference-between-references_many-and-embeds_many-in-mongoid/
我这边一个移动社区产品的统计分析就是用的你的 fork 版本,哈哈
用 Gemfile 也不是一个一个 require 吗?
提示一个一行 require gem 或标准库 (其实就是$LOAD_PATH 里的)的一个稍微简洁版 %w[yaml abbrev mathn matrix].map &method(:require) 不过要注意加载引用顺序哦~
#3 楼 @yedingding +1
#13 楼 @jinleileiking 坐等支持中文 URL 解析~
#15 楼 @huacnlee @jinleileiking 我用的这个https://github.com/busyloop/lolcat,只是为了一个彩虹式的展现效果~