Ruby 请教下 HTML to pdf or image 的解决方案

wikimo · 2012年03月28日 · 最后由 chitsaou 回复于 2012年03月29日 · 3817 次阅读

需求:需要将某个站的首页每天定期转换成图片或者 pdf

试用了 wkhtmltox (http://code.google.com/p/wkhtmltopdf/) 这个东西,测试了自带工具和 PHP 示例,发现不太好使,可能会出现无法生成的现象,还有个问题是乱码,乱码应该相对容易解一些,但是有时候有些站生成不了。 请教下 ruby 下是否有好的解决方案,哪位童鞋有做过类似应用,3Q

这个不得一定需要使用 ruby 来做,什么样的工具合适就用什么样的来做。我之前研究过,很好用。 http://cqror.com/blog/2011/10/12/capture-webpage/

你在服务器端用 ruby 写个脚本使用 system 方法来调用命令生成图片,再用 crontab 定时。

@qichunren 对比了下觉得 phantomjs 这个工具是蛮好用的,但是截出来的效果不是很理想,和手动截取的有差别

@qichunren 又试了下,基本可以解了,对于 swf 这种东西也不能要求太高

简单的 HTML 导出 PDF 还是比较容易的,但是 HTML 里面如果有复杂样式 (特殊字体) 和 JS 动态生成的内容就会有很多问题,基于 wkhtmltox 的方案要是不能达到目标可以试试下面两个完全不同的办法。

这个:https://github.com/amardaxini/acts_as_flying_saucer 或者:http://www.princexml.com/ ( https://github.com/mbleigh/princely )

看看 pandoc 行不行

这个试试(上次 Ruby 5 介绍的) https://github.com/igor-alexandrov/wisepdf

需要 登录 后方可回复, 如果你还没有账号请 注册新账号