需求:需要将某个站的首页每天定期转换成图片或者 pdf
试用了 wkhtmltox (http://code.google.com/p/wkhtmltopdf/) 这个东西,测试了自带工具和 PHP 示例,发现不太好使,可能会出现无法生成的现象,还有个问题是乱码,乱码应该相对容易解一些,但是有时候有些站生成不了。 请教下 ruby 下是否有好的解决方案,哪位童鞋有做过类似应用,3Q
这个不得一定需要使用 ruby 来做,什么样的工具合适就用什么样的来做。我之前研究过,很好用。 http://cqror.com/blog/2011/10/12/capture-webpage/
你在服务器端用 ruby 写个脚本使用 system 方法来调用命令生成图片,再用 crontab 定时。
@qichunren 对比了下觉得 phantomjs 这个工具是蛮好用的,但是截出来的效果不是很理想,和手动截取的有差别
@qichunren 又试了下,基本可以解了,对于 swf 这种东西也不能要求太高
简单的 HTML 导出 PDF 还是比较容易的,但是 HTML 里面如果有复杂样式 (特殊字体) 和 JS 动态生成的内容就会有很多问题,基于 wkhtmltox 的方案要是不能达到目标可以试试下面两个完全不同的办法。
这个:https://github.com/amardaxini/acts_as_flying_saucer 或者:http://www.princexml.com/ ( https://github.com/mbleigh/princely )
看看 pandoc 行不行
这个试试(上次 Ruby 5 介绍的) https://github.com/igor-alexandrov/wisepdf