结合一些简单的 API,nokogiri 用起来是很简单 三两下就能把一堆网页数据提取出来放到数据库
但哪位大神能说说其原理的
据说所知底层解析 HTML 之类的库是用 C 写的。从一个视频里看到的。
觉得看 C 痛苦的话可以看它的 java 实现
@ywjno 还是看 C 吧...我觉得 java 比较痛苦
#3 楼 @richard_ma 会啥看啥,总有一款你不痛苦