想想看,当漫山遍野都是关键字屏蔽带来的***,作为站点管理员就没有责任吗?这个网站就“文明”吗?
任何网上言行都应该文明。所以出现了关键字屏蔽一说。也就是把用户发表的文字中的不文明词汇加以替代。
一般的做法,好像就是准备一个关键字列表,然后遍历用户输入的文本,当发现不文明词汇时,将该词汇替换为指定内容。
所以,就出现了很多搞笑的内容。我举几个简单例子(也不知道博客园会不会屏蔽掉),看看朋友们能不能猜出被屏蔽的内容(本文后面给出答案):
1 谋网游,“在没有你的**子里”;
2 某blog,“微软的这项技术极**利了开发者的工作”;
3 某技术网站,“把Virtual Server当作一**立的服务器”;
最近打算自己写个blog玩玩,练练技术顺便检验一下自己的水平。不由得想到了内容审核和关键字屏蔽问题,也不由得想到了自己过去遇到的这些哭笑不得的“不文明内容”。
-- Begin: Thinking Section --
关键字屏蔽,本身是一件好事情,而且其技术研究起来也会比较有意思。但是在做关键字屏蔽时,要清楚自己的目的。
Anders Liu认为,关键字屏蔽存在的主要目的有二:
1 免责。将关键字替换为**或其他内容,避免了用户通过在搜索引擎中输入不文明词汇(包括政治词汇)来找到自己站点中的内容,同样也避免了好事之人通过此途径找到自己的站点,这将给站点的管理者们减少很多麻烦。
2 文明。自己的站点看上去“形势一片大好”,多么和谐。
然而,关键字屏蔽真的能实现这两个目的了么?给大家讲个老笑话:
A:老C说话可真脏!
B:他说什么了?你把脏话去掉再说给我。
A:我,你,他。
B:……
想想看,当漫山遍野都是关键字屏蔽带来的***,作为站点管理员就没有责任吗?这个网站就“文明”吗?
况且,关键字屏蔽是很容易被突破的,用户可以随意编纂一些大家都看得懂,唯独关键字屏蔽系统看不懂的词汇,来表达他“不文明”的思想。后面给出答案时,也会给出一些逃避方法。
那如果把关键字列表做得庞大些,甚至加入自学习功能,可以不断添加词条呢?物极必反,当屏蔽的关键字太多时,就会出现比本文前面例子更加哭笑不得的言语。
应该怎么办?
对于个人开发者,像Anders Liu这样子想自己写着玩的,我想我会准备一个可以扩充的关键字列表,当发现“不文明词汇”时,给用户一个提示,“您输入的内容‘……’中有敏感词汇‘xxx’,您可以:点击[Yes],坚持发表我的内容;点击[No],换一种说法后再发表”,同时将输入框焦点放置到出现问题的文本上。
对于企业或者营利性网站而言,Anders Liu则认为,靠人参与的审核制度必须存在,而且不能偷工减料。
BBS是一种非常成熟的内容发布机制,几乎所有的BBS都有这样一批人存在——版主/管理员,而一些大型、超大型BBS甚至还设有专门的审贴员,这些人的职责就是一旦发现违规内容,轻则删贴,重则封帐号。
在新闻站点中,这项工作更加严厉,甚至一篇新闻在发布之前,就要经过层层审批。
但在Blog站点中,这一工作就逊色的多。这其中主要的原因在于,BBS和新闻都是以内容为导向的,也就是说,不管是谁发布的内容,都会集中在一个区域中体现,这个区域中放置着所有相关的内容;而Blog则是以用户为导向的,用户发表的内容,都集中在自己的一个区域中存放,除非站点提供某种机制,将类似的内容划分到一起。
因此,针对Blog进行审核试比较麻烦的——1 管理员/审贴员不可能每天浏览每一个用户的blog,对新发布内容进行审核;2 如果将所有人新发布的内容罗列在一个后台页面中等待审核,又很难对内容进行有效的划分,从而将审核工作分配给不同的人去完成。
另外,随着Web2.0概念的逐渐明晰,“全民参与”的精神逐渐普及,一些Blog站点都提供了“给文章打分”、“将文章推举到首页”或“举报该文章”等功能。这里的“举报”很有用,但是,1 需要避免恶意举报,即便一篇文章遭到举报,也应该在管理员审阅后再决定是否删除;2 总有漏网之鱼,虽然其内容是“不文明”的,但代表了绝大多数群众的看法,因此得不到举报(在高歌主旋律的和谐社会里,作为管理者,还是封杀掉这类内容比较好,嘿嘿)。
面对这种情况,Anders Liu也很头痛。不过好在,现在绝大多数Blog站点都提供了“标签”。这样的话,可以针对用户提供的标签对内容进行划分,然后由不同的人员完成审批。当然,如果一篇文章提供了多个标签后,很可能导致一篇文章需要经过多人审核;不过没有关系,文章是先发布出去的,然后进行审核(像绝大多数论坛一样),不会影响“文明”内容的时效性,同时,一旦多个审核员中的任何一个删除了该文章,那么就认为该文章未通过审核。
同时,举报制度依然存在,被举报的文章也会根据其标签,投递到相应的审贴员名下,由审贴员决定是否真的删除。
这里还存在一些问题,就是如何面对逐渐膨胀的标签列表?如果用户不填写标签怎么办?
……呵呵,路漫漫其修远兮,Anders Liu将上下而求索。
-- End: Thinking Section --
现在公布答案:
1 “在没有你的日子里”;逃避方法:曰(注意,Y胖了)、R、Ri。(如果扩充关键字列表,把曰和R都加进去,呵呵,结果是,人们看了屏蔽后的言语,不难联想到“子曾经日过”,不文明呀不文明;还有,你知道什么是“*o*”吗?
2 “微软的这项技术极大便利了开发者的工作”;逃避方法:大.便(注意这一砣把把中有杂质)、Shi.t。
3 “把Virtual Server当作一台独立的服务器”;逃避方法,嗯,太敏感了,不要逃避,删就删了吧……
亲爱的朋友们,你有还有遇到什么类似的“不文明”内容吗?或者你对关键字屏蔽有什么其它看法?或有什么解决方案?
(正文完)
P.S. 为什么我要发布到博客园首页?
博客园首页要求:1 经过自己认真思考,2 最受关注,3 给别人带来收获。
1 不用说了,从本文就能看出Anders Liu没少瞎琢磨。
2 Blog依然是近几年最热的互联网内容,而其中出现的“不文明”现象值得讨论。
3 Anders Liu给出了一些解决问题的思想,虽然还不成熟,但相信可以给很多想写、或正在写Blog的朋友提供一些灵感。
望dudu和各位网友理解~ 也希望大家踊跃参与讨论~