用 mechanize, nokogiri, wget, curl 等获取的页面内容 跟用人工手动打开页面 在内容上有区别
请问这是怎么做到的
我用 mechanize 设置了 agent.user_agent_alias = 'Mac Firefox' 也没什么用
请问怎么解决类似的问题,如果要保持内容一致
@huacnlee @h_minghe @jerrychen2008 @nightire http://www.aliexpress.com/wholesale?SearchText=princess+sofia+dress 有空试试,人工打开的内容跟用程序获取的不太一样
我尝试
curl -L http://www.aliexpress.com/wholesale?SearchText=princess+sofia+dress > log.html.
然后
open log.html
发现和直接在浏览器中直接打开的页面对比了一下,似乎商品列表的方式不一样。
@Rei sorry, 没注意到。。比如我用 wget 获取的页面,最后一个商品是价格 US $11.88,而用浏览器看到的最后一个商品则价格是 US $8.64 - 10.02