c#倒是可以读取现成的word文件的分页数据。
ruby 有没有类似的 gem 呢,看了下 caracal 很强大,英文不好,这几天在看它的源码找解决办法。
docx 就是一个 zip 文件,主体是 xml。不过建议还是 pandoc 解决
tks,又把 pandoc 给忘了,caracal 作者回复我了,我用错了 caracal