瞎扯淡 百度:360 违反 Robots 可能导致网民隐私泄露

chairy11 · 2013年10月17日 · 最后由 whitebox 回复于 2013年10月18日 · 2932 次阅读

原文:《百度:360 违反 Robots 可能导致网民隐私泄露》 http://tech.cnr.cn/techhlw/201310/t20131016_513843151.shtml

“此前,360 服务器抓取网民隐私存在自己的服务器上,因自身网站的漏洞被谷歌搜索抓取,导致奇瑞汽车内部采购文件、三峡集团财务报表等商业秘密,以及 140 万网民隐私被泄露和传播。” “这类利用客户端上传信息并放到搜索上的行为,可能引发网民隐私大面积泄露。如果一位证券公司的工作人员,不慎用 360 浏览器查看了客户的姓名、银行账号、密码等信息,那么客户账号和密码可能就会被搜索到并公之于众;如果一个公司高层,用 360 浏览器查看了公司内部机密数据,那么这个公司的核心商业机密也可能就会被竞争对手直接搜索到。” “2008 年,大众点评曾状告爱帮网,以“垂直搜索”之名,无视 Robots 协议,将大众点评花费心血组织用户发布的点评内容抓到自己的平台上。最终,法院判决爱帮网败诉,除了赔偿最高限额外,也要立即停止这一侵权行为。法院认为,这些信息内容被爱帮网未付出劳动、未支出成本、未做出贡献,却直接利用技术手段在爱帮网上展示,并以此获取商业利益,属于反不正当竞争法理论中典型的“不劳而获”和“搭便车”的行为。”

这世界好危险……

妹子,还有更危险的呢 ...

狗咬狗,媒体赚美了 跟律师一样一样的,吃完原告吃被告

百度什么时候遵守过

遵守?只要有证据,可以告上法庭。

中国注重道德,法律不是很给力。

妹子 让我们一起冒险。😄

#6 楼 @hbin #3 楼 @kingwkb #1 楼 @HanHor 额,我只是在担心,如果我的网站有些信息不想让搜索引擎抓取,但他们又不遵守原则抓取了怎么办? 另外,像我有些设置了密码的博客、QQ空间的文章,普通网民是进不了,但搜索引擎会不会抓过去了? 邮件呢?如果我邮件中附件有商业计划书之类的东西,信息会不会被抓取?

啊啊啊,好危险的世界!

安全当然不能靠 robots.txt, 它只是一纸明文,360 不读取,其它 spider 也会去读取。你自己敞开门然后写张纸条说不能从这里进!期望没有贼会进去偷东西这不很搞笑吗?

其实我想说,哪个脑子少根筋的家伙会把内部采购文件和商业报表之类的东西公开放在网上给 360 来捉?

#8 楼 @gihnius 不是人家自己公开放在网上的,报道原文说的是“如果一位证券公司的工作人员,不慎用 360 浏览器查看了客户的姓名、银行账号、密码等信息,那么客户账号和密码可能就会被搜索到并公之于众;如果一个公司高层,用 360 浏览器查看了公司内部机密数据,那么这个公司的核心商业机密也可能就会被竞争对手直接搜索到。”

谈法人道德就是耍流氓,组织越大做坏事的背德感就被分担得越轻,只能靠法律去限制. 但种花国没规定什么属于隐私,除非能举证网站信息的泄漏对你产生了伤害,否则估计很难告。

#11 楼 @bhuztez 呐,不懂……啥意思?

#3 楼 @kingwkb 诸如各主流爬虫普遍遵守的 user-agent 匹配和 disallow 路径这类比较老派的规则,百度爬虫还是一向遵守的,但是 crawl-delay、request-rate 这些比较潮的就玄了。

#14 楼 @skybraver 我不知道你说百度一向遵守是从哪里看出来的,你搜一下 淘宝网,现在百度加了个说明,但是还能搜到,以前要不是淘宝发声明这样做,百度连个说明都没有

#15 楼 @kingwkb 百度一直挂着淘宝首页,不然有上百度搜"淘宝"进网站习惯的被钓鱼上哪儿哭去。要是百度真的无视 robots 的 Disallow 照样索引淘宝内容页,这几年做淘宝客垃圾站的日子哪有过得这么舒服。

360 不遵守 robots 的事情已经出现很久了 没有 robots 的时候 UA 是 360spider,有 robots 的时候会用另外一个 UA 爬

需要 登录 后方可回复, 如果你还没有账号请 注册新账号