新闻产经轻工日化电器通讯仪器机械冶金矿产建筑建材石油化工食品医药电子电工能源电力交通运输农业环保图片手机版
当前位置:中国市场调查网>产业>科技>  正文

搜狐称其社区帖子每天约20万条 过滤4万条

中国市场调查网  时间:08/23/2010 10:34:24   来源:南方都市报(广州)

  南都讯 据《北京晚报》报道 目前,新浪、搜狐、网易、腾讯、人民网等各家网站都有微博。搜狐网监控中心负责人王国欣告诉记者,包括微博、博客在内的网民互动式互联网产品,文字帖一般采用1000多个敏感词进行过滤,如果其中含有敏感词就直接删除。这些敏感词主要是涉枪、涉黄、涉暴的内容。

  据悉,微博被过滤掉的内容,绝大多数是涉黄,另外就是发帖做广告,或者是用语言攻击其他人。王国欣说,搜狐微博是24小时都有人做过滤监控,微博每天出现的七八万个帖子,过滤掉的大约有5000多个。在搜狐社区每天出现的20多万个帖子中,有4万多个会被过滤掉。

  除了文字要进行过滤监控,图片过滤也是互联网监控的一个重要内容。王国欣称,搜狐对网民在搜狐社区上传的图片采取软件自动过滤加人工审核的方法,搜狐使用的软件名为图片过滤器,能通过肤色、纹理、动作、人脸等多个参数,对图片进行要素的提取。“人的肤色介于红黄之间,当肤色大于一张图片面积的40%,图片就基本认定为情色图片,进入人工审核程序。”狮子的皮毛是黄颜色,这样的图片会不会直接过滤掉呢?对于这样的疑问,王国欣说,图片过滤的一个选项是纹理,通过软件可以发现狮子的边缘很杂乱,与人体图片的边缘不同,不会被过滤掉。

  记者在搜狐公司看到,一位负责网络监控的员工正在进行图片的人工审核。网民上传的照片按照每行5张、每屏40行的标准显示在电脑屏幕上。当发现照片有露点、挑逗动作内容时,他就会在图片下面的方框内点一下,图片就不会上传到网上公开发表了。

  (本文来源:南方都市报)