Ruby List Comprehension in Ruby

liqiang · 2015年01月11日 · 最后由 luikore 回复于 2015年01月12日 · 3414 次阅读

在Haskell 的网站上看到了一道数独的题目，和一系列不同的解法。

其中最精简的一个解法是这样的：

Module Main where f x s@(h:y)=let(r,c)=divMod(length x)9;m#n=mdiv3==ndiv3;e=[0..8]in [a|z<-['1'..'9'],h==z||h=='.'&& notElem z(map((x++s)!!)[i*9+j|i<-e, j<-e,i==r||j==c||i#r&&j#c]),a<-f(x++[z])y] f x[]=[x] main=print$f[]"53..7....6..195....98....6.8...6...34..8.3..17...2...6.6....28....419..5....8..79"

原始链接在此

这份代码可以先不着急读，后面会详细讲解。

这个解法代码非常少，其实算法也是普通的回溯法。具体来说就是从前到后检查所有没填数字的位置，排除与这个数字同一行、同一列、及处在同一个块中的所有数字，然后从剩下的数字中挑选一个填上去，再对下一个没填数字的位置做相同的操作，直到把棋盘上所有的位置都填完。如果在某个位置上找不到可用的数字，则回溯到上一个位置，尝试下一个可能的数字。

使用 ruby 写出来的代码可以是这样的：

BLOCK_SIZE = 3
PANEL_SIZE = BLOCK_SIZE * BLOCK_SIZE

def nums_in_row(panel, index)
  row_start = (index / PANEL_SIZE) * PANEL_SIZE
  panel[row_start..row_start + PANEL_SIZE - 1]
end

def nums_in_column(panel, index)
  column = index % PANEL_SIZE
  (0..PANEL_SIZE - 1).map{|row| panel[row * PANEL_SIZE + column]}
end

def nums_in_block(panel, index)
  block_row = index / PANEL_SIZE / BLOCK_SIZE
  block_column = index % PANEL_SIZE / BLOCK_SIZE

  nums = []

  (0..BLOCK_SIZE - 1).each do |block_i|
    (0..BLOCK_SIZE - 1).each do |block_j|
      row = block_row * BLOCK_SIZE + block_i
      column = block_column * BLOCK_SIZE + block_j
      nums << panel[row * PANEL_SIZE + column]
    end
  end
  nums
end

def all_possible_next(state)
  target_index = state.index 0
  used_nums = (nums_in_row(state, target_index) +
                nums_in_column(state, target_index) +
                nums_in_block(state, target_index)).uniq
  ((1..PANEL_SIZE).to_a - used_nums - [0]).map do |num|
    cloned = state.clone
    cloned[target_index] = num
    cloned
  end
end

def all_filled?(state)
  state.none?{|num| num == 0}
end

def solve(original)
  stack = []
  stack.push original

  solutions = []

  until stack.empty?
    current = stack.pop
    all_possible_next(current).each do |state|
      if all_filled? state
        solutions << state
      else
        stack.push state
      end
    end
  end
  solutions
end

代码量上差距巨大！那为什么用 Haskell 可以写的这么简洁呢，其中一个很重要的原因已经写在这道题答案的 url 中了，它使用了 List Comprehension。

原始的代码变量名比较随意，不太好读，我把它稍微重构了一下，如下：

module Main where
f :: [Char] -> [Char] -> [[Char]]
f x s@(h:y)=let (row,column)=divMod (length x) 9
                inSameSegment m n = m`div`3==n`div`3
                availNums=[0..8]
                inSameBlock x1 y1 x2 y2 = inSameSegment x1 x2 && inSameSegment y1 y2
                usedNums = map((x++s)!!)[i*9+j|i<-availNums,j<-availNums,i==row||j==column||inSameBlock i j row column]
            in
              [a|z<-['1'..'9'], h /= '.' || h=='.' && notElem z (usedNums), a <- f (x++[z]) y]
f x []=[x]

main=print $ f [] "53..7....6..195....98....6.8...6...34..8.3..17...2...6.6....28....419..5....8..79"

其中这部分

[i*9+j|i<-availNums,j<-availNums,i==row||j==column||inSameBlock i j row column]

就是一个典型的 list comprehension。这个表达式返回的是一个数组（Haskell 中其实叫列表）它的计算过程是：i 和 j 分别可以是 availNums 这个数组中的任意元素，如果 i 和 j 的某个组合满足这个条件

i==row||j==column||inSameBlock i j row column

那么 i*9+j 就会成为最终返回的数组中的一个元素。对于这个例子，可以简单的理解为一个两重循环，像这样：

result = []
availNums.each do |i|
  availNums.each do |j|
    if i==row||j==column||inSameBlock(i, j, row, column)
      result << i*9+j
    end
  end
end

直接写两重循环还可以忍受，但是如果再深就没法看了。但是使用 list comprehension 就还好，因为多余的元素足够少。那么好吧，就让我们实现一个 ruby 的 list comprehension 吧。

def lc_internal(lists, params, condition_proc, result_proc)
  l = lists.first
  if l.nil?
    case params.size
      when 1
        if condition_proc.call params[0]
          [(result_proc.call params[0])]
        end
      when 2
        if condition_proc.call params[0], params[1]
          [(result_proc.call params[0], params[1])]
        end
      else
        raise 'only support at most 2 list'
    end
  else
    l.map do |ele|
      vals = lc_internal lists[1..-1], params + [ele], condition_proc, result_proc
      vals.nil? ? [] : vals
    end.reduce(:+)
  end
end

def list_comprehension(*lists, condition_proc, result_proc)
  lists.first.map do |ele|
    lc_internal lists[1..-1], [ele], condition_proc, result_proc
  end.reduce(:+)
end

其中向外暴漏的是 list_comprehension，它包含了三个参数，第一个参数可以接受多个数组；第二个参数是个 Proc，用来判断某个组合是否满足指定的条件；第三个参数也是个 Proc，使用这个组合来计算出相应的值，这个值，如前面提到的，会成为最终返回数组中的一个元素。关于“如何把一个数组传递给多个参数的函数这件事情”，不知道怎么做，所以写了一个丑陋的 case 语句，目前只能支持两个列表，多了就报错了！

然后再回到第一个版本的 ruby 代码，使用 list_comprehension 之后，主要变化的地方就是 all_possible_next 这个函数，现在这个函数变成这样了：

def all_possible_next(state)
  avail_nums = (0..PANEL_SIZE - 1).to_a

  target_index = state.index 0
  row = target_index / PANEL_SIZE
  column = target_index % PANEL_SIZE
  used_nums = list_comprehension(avail_nums, avail_nums,
                               Proc.new{|i, j| i == row or j == column || (i / 3 == row / 3 && j / 3 == column / 3)},
                               Proc.new{|i, j| state[i*9+j]}).uniq
  ((1..PANEL_SIZE).to_a - used_nums).map do |num|
    cloned = state.clone
    cloned[target_index] = num
    cloned
  end
end

当然了，原来版本中的前三个函数也都不需要了。原来的 63 行代码变成现在 43 行了，少了 1/3。这份 ruby 代码可以继续优化，不过本文就到此为止了。

函数式编程中真是有不少好东西，可以借鉴到其他语言中用。

4 个赞

zlfera #0 2015年01月12日

不错，顶一下

luikore #1 2015年01月12日

list comprehension 就是 filter 加 map 而已，而且 ruby 也有 divmod 啊...

def row n
  n...(n+9)
end

def col n
  (0...9).map{|x| x*9 + n }
end

def box m, n
  [m, m+1, m+2].product([n, n+1, n+2]).map{|i, j| i*9 + j}
end

def f x, a
  x -= 1
  return a if x < 0
  return f(x, a) if a[x] != '.'
  a = a.dup
  q, r = x.divmod 9
  ds = ('1'..'9').to_a - a.values_at(*row(q*9), *col(r), *box(q/3*3, r/3*3))
  ds.find {|d| a[x] = d; return r if (r = f x, a) }
end

r = f 81, "53..7....6..195....98....6.8...6...34..8.3..17...2...6.6....28....419..5....8..79".chars
puts r.each_slice(9).map(&:join)

还有一行流解数独不过太魔法

cloudqq #2 2015年01月12日

程序写简单了，会不会增加理解难度呢

kikyous #3 2015年01月12日

#2 楼 @luikore 偶像，你来啦！你在上班吗？

luikore #4 2015年01月12日

#4 楼 @kikyous 今天成人节...

liqiang #5 2015年01月12日

#2 楼 @luikore 你这个解有错误，box 这个函数只包含了一个块内对角线三个元素的下标。

另外这行代码

ds.find {|d| a[x] = d; return r if (r = f x, a) }

的逻辑有问题吧，if (r = f x, a) 永远都是真，那么程序并不会尝试 ds 里面所有的值，每次都是尝试了第一个就返回了。而且在 block 中加 return 语句的写法也太诡异了。。。

关于 list comprehension，这里例子可能还不是很典型，之前见过这样一个例子挺好的：在每条边都小于 100 的三角形中，找出所有直角三角形，并列出三条边的长度

[(a,b,c) | a<-[1..100],b<-[1..a],c<[1..b],c^2+b^2==a^2]

map 加 filter 搞不定 list comprehension 哦，起码要先来个笛卡尔积。

luikore #6 2015年01月12日

#6 楼 @liqiang 你说的对... 应该是 product 而不是 zip, 已经改正

f x, a 在找不到匹配值的时候会返回 nil, 不是永远为真的 (find 在空 ds 或者所有尝试都失败后返回 nil)

block 里 return 很正常啊，写多了你就习惯了

liqiang #7 2015年01月12日

#7 楼 @luikore 恩，看懂了，这个解法是得到一个合法解就返回了，不会求出所有的解。

luikore #8 2015年01月12日

@liqiang 三角形这个例子不错，但是你实现的 list_comprehension 也不支持动态范围的 b, c, 那么这么写

list_comprehension [*1..100], [*1..100], [*1..100],
  proc{|a, b, c| c**2 + b**2 == a**2 },
  :itself.to_proc

就相当于这么写而已：

[*1..100].product([*1..100], [*1..100]).select{|a, b, c| c**2 + b**2 == a**2}.map &:itself

需要登录后方可回复, 如果你还没有账号请注册新账号