安全 简书沦陷了么?

wikimo · 2015年03月09日 · 最后由 wikimo 回复于 2015年03月09日 · 9482 次阅读

直接看图说话吧,早晨随便截了几张图(App),从 teahour 上听到,关注简书很久了,运营了几年了,内容质量还不错,每天都会打开瞄几眼,不过貌似被人盯上了。内容阅读类应用总会遇到这样的问题,我不知大家是如何解决此类问题的。说说自己的经验吧,方法比较土,晚上有人值班监管内容,到点后禁止发布内容,第二天工作日继续开启,同时,加入了一些过滤机制。

刚打开简书,发现确实有这个问题。 这种垃圾信息,一般是凌晨至早晨最多,除验证码、敏感词过滤之外,我们有几层过滤机制:对于新会员发布的内容,必须通过人工审核后才能被别人看到;对于发布多次内容后的会员,可人工确认其是否需要再审核;对于实名认证会员,不需审核。

加审核什么的,就太没有意思了,想想发布了内容,还要等,瞬间就没有写的欲望了。

应该没有根本性的方案,主要还是人工 + 机器配合改善,找一个平衡点,审核,针对什么对象,什么内容进行审核,什么时候引入审核机制……

不能把这些信息举报到有关部门,封杀吗....

#4 楼 @yzdel2000 这和你手机偷了,然后告诉警察叔叔让他帮你找回类似,比较困难,取证困难,全国这么多论坛,社区,如果都这么干,警察叔叔也忙不过来,举报的过程中还需要取证,调查。

内容一多起来就会碰到这种问题,确实蛋疼。只能慢慢解决了

我们就是一些简单的机制,比如加一定门槛,然后关键字过滤。之后就是人工

将人工判断为 spam 的文章放入到一个集合,新发的文章对这个集合中进行相似度算法过滤,考虑到避免算法误杀,可以将过滤掉的文章再放入一个 list, 每天运营人员扫一眼就可以了。

用贝叶斯机器学习。

#7 楼 @quakewang content-based filter

感谢提醒,内容已经被处理,spam 的防御和过滤我们也在慢慢尝试,会一点一点变好的。:D

@quakewang 挺棒的,学习了,相比敏感词库这一类方案应该更靠谱些,主要是在相似度算法的实现上。 discuz / phpwind 的处理方案是,敏感词库,但是也不是很好使,discuz 的方案优于 phpwind。

简书确实在一点点变好,遇到这些问题也未尝是坏事,说明关注度在提高。 @larryzhao

需要 登录 后方可回复, 如果你还没有账号请 注册新账号