新手问题更新元素的比较问题

Kirisames · 2021年07月22日 · 最后由 mizuhashi 回复于 2021年07月23日 · 540 次阅读

场景

运维现在需要测定数据库的更新频率，数据使用爬虫爬取。

返回两个 JSON 文件，代表着一个月前的数据和现在的数据。
例子：

// a month ago
{"id":  "111","name":  "kirisame", "age": 16, "info": "I like Mushroom"}
{"id":  "222","name":  "reimu", "age": 16, "info": "I like Sleep"}
{"id":  "333","name":  "Scarlet", "age": 300, "info": "I don't like sunshine"}

{"id":  "111","name":  "kirisame", "age": 16, "info": "I like Mushroom and fireworks"}
{"id":  "222","name":  "reimu", "age": 16, "info": "I like Sleep and money"}
{"id":  "333","name":  "Scarlet", "age": 300, "info": "I don't like sunshine"}

目前需要统计有多少个条目是和之前不同的，以此确定更新频率

想法

分别读入两个文件，并用数组存储

循环某一个数组（假设循环现在的数组），然后每条去另一个数组（一个月前的数组）查找修改情况。不过这种数组查询应该不行，效率太低了。
两个数组都按照 id 字段排序，然后使用循环查看对应情况。不过这样需要注意条目的增加，需要一些判断条件。
把这些数组转换成 hash，使用 id 做 key，字段为 value。这个方法有什么好一些的写法吗？
我目前的想法：

def conver_array_hash(input_array)
    hash = {}
    input_array.each do |element|
        hash[element[:id].to_sym] = element.except(:id)
    end
    hash
end