目前在写一个日式漫画绘画素材收集的网站,图片采用浏览器插件和用户上传两种。
插件通过用户在图片上右键点击,程序发送图片地址和当前标签地址。
插件在百度,pixiv,dribbble,花瓣 这些网站上下载成功,部分出现 403。
但是即使采集到图片,记录的来源地址依旧不可用。
举个例子:
用户进入 pixiv 小图页面 -> 大图页面 -> 采集 -> 程序记录来源地址(大图地址),如下图
红框地址是大图地址,也就是抓图的标签地址,但直接访问会 403,因为少了 referer。
神奇的是花瓣会去到小图的地址,这个可以直接访问,比如这张: http://huaban.com/pins/192691958/
我想知道他是怎么做到的...或者说有什么比较靠谱的思路?