Ruby CSV 文件如何做一个类似合并单元格的操作

mfb777 · 2018年09月12日 · 最后由 swordray 回复于 2018年09月14日 · 9035 次阅读

比如有这样的一个 CSV 文件：

有什么比较优雅的方法可以变成这样：

{
"A": ["123", "1223", "12343", "122XX33"],
"B": ["678","612378", "67XX8"],
"C": ["100", "1000"]
}

dfzy5566 #0 2018年09月13日

CSV 应该有个 header 的，可以利用inject，像这样：

data = [
  {h1: 'A', h2: '123'},
  {h1: 'A', h2: '1223'},
  {h1: 'A', h2: '12343'},
  {h1: 'A', h2: '123XX33'},
  {h1: 'B', h2: '678'},
  {h1: 'B', h2: '612378'},
  {h1: 'B', h2: '67XX8'},
  {h1: 'C', h2: '100'},
  {h1: 'C', h2: '1000'}
]
data.inject({}) { |r, e| r[e[:h1]] = Array(r[e[:h1]]) << e[:h2]; r }
#=>  {"A"=>["123", "1223", "12343", "123XX33"], "B"=>["678", "612378", "67XX8"], "C"=>["100", "1000"]}

# or

data.map{|x| Hash[*x.values]}.inject(&lambda{|x,y| x.merge(y){ |_, o, n| [o, n].flatten }})
#=> {"A"=>["123", "1223", "12343", "123XX33"], "B"=>["678", "612378", "67XX8"], "C"=>["100", "1000"]}

1 个赞

mfb777 #1 2018年09月13日

感谢，这段代码很烧脑。inject 的方法大概看懂了。

第二个方法大概看了下好像更恐怖的样子。

ForrestDouble #2 2018年09月13日

pandas

quakewang #3 2018年09月13日

可以先用数组的前一个元素做 group_by，然后用 map! 方法将后一个元素做 replace：

data = [['A', '123'], ['A', '1223'], ['A', '12343'], ['A', '122XX33'], ['B', '678'], ['B', '612378'], ['B', '67XX8'], ['C', '100'], ['C', '1000']]

data.group_by(&:first).each{|_, v| v.map!(&:last)}

# => {"A"=>["123", "1223", "12343", "122XX33"], "B"=>["678", "612378", "67XX8"], "C"=>["100", "1000"]}

3 个赞

luikore #4 2018年09月13日

h = {}
data.each {|a, b| (h[a] ||= []) << b }

如果想要奇技淫巧，可以用 Sqlite 的 CSV mode ...

4 个赞

hooopo #5 2018年09月14日

textql -header -sql "select name, group_concat(value) from csv group by name" csv.txt

gonglexin #6 2018年09月14日

对

hooopo 回复

TextQL 确实很好用，省了很多事。

mfb777 #7 2018年09月14日

对

quakewang 回复

其实我就是想要这个函数 group_by，在 Array 类里找了半天无果。

swordray #8 2018年09月14日

data.group_by(&:first).transform_values { |value| value.pluck(1) }

9 楼已删除

需要登录后方可回复, 如果你还没有账号请注册新账号