-
机器猫过关,加菲猫过滤——“绿坝-花季护航“的是与非 - [夏言]
2009-06-29
版权声明:转载时请以超链接形式标明文章原始出处和作者信息及本声明
http://siyueleibo.blogbus.com/logs/41653375.html
机器猫过关,加菲猫过滤——“绿坝-花季护航“的是与非
作者: 南方周末记者 胡贲 实习生 郭仕鹏
■软件会对大面积的黄色区域的图片敏感,对大块黄色块的图片也会有误判。如果是黑色、红色肤色的裸体图像,程序未能识别。测试包含机器猫(蓝白色)、Kitty猫(红白色)和加菲猫(黄色)相近姿势图片的网页,“机器猫”和“Kitty猫”均能顺利过关,有部分包含“加菲猫”图片的网页被判断为不良网站,被程序过滤。
■“本产品可以过滤互联网上的不良信息,但不保证不良信息能完全被过滤,也不保证被过滤的信息完全是不良信息。”
“我首先感到的是恐惧!”广州网民陈先生说他知道电脑以后必带“绿坝-花季护航”软件时的感受。工业和信息化部此后说,软件不监控网民,不强制安装。
据门户网站新浪的调查,80%多的投票者表示不考虑使用该软件。他们和陈先生一样,担心网上行为被“偷窥”,隐私领域被侵犯。
此次由政府出面强制性地要求全社会使用一个软件,极为罕见,因而加重了大众和舆论的“联想”。据测试过“绿坝-花季护航”的业内人士称,该软件其实并不是那么“凶悍”,反而是此项政策的实施过程,有可完善、使之更严谨之处。
黑人图片怎么办?
此事件,使两个原本名声不大的公司一下浮出水面——郑州金惠计算机系统工程有限公司和北京大正语言知识处理有限公司,他们是该软件的联合开发者,前者主要负责图像过滤,后者主要负责文字过滤。
工信部的通知曝光后,两个公司迅速成为网民关注的焦点。6月9日晚间,有网民发现金惠公司网站的一些网址,点击它们可以直接看到色情图片。到6月10日,再点击时已经打不开。据业内人士分析,这些图片应是金慧公司用以检验过滤识别效果的素材,本应是内部管理,但不知什么原因居然可以直接访问。
早在今年4月8日,教育部、财政部、工信部、国新办就联合发文,要求全国中小学所有联网电脑必须安装“绿坝-花季护航”,南方周末记者获得的一份安徽省教育厅转发的文件中表明,根据“四部门”的要求,各中小学务必确保于2009年5月底之前完成安装。另一方面,方正、海尔等国内品牌也向本报确认,根据工信部要求,家电下乡中标的电脑,已经全部预装了“绿坝-花季护航”。以此预估,很快,“绿坝-花季护航”将成为中国装机量最大的正版软件。
据有关测试,该软件为可装可卸。
根据金惠公司的“绿色上网过滤软件产品招标”“响应书”,其对色情图像的辨识主要通过对肤色区域进行辨识,看是不是足够“暴露”,然后根据肤色区域的形状,判定是否为色情图片。同时,再加上“人脸识别判定”进行修正。
对此,该业内人士分析道,“最大最明显的漏洞是,黑人色情图片怎么办?”经测试,该软件对黑色及红色人种的色情图片的识别效果确实不佳。
而另一方面,绿坝软件的客服证实,该软件采用隐藏的后台进程。用户开机后并不知道是否启用。因此会发生尽管没有调用程序主界面,依然会在运行时突然关闭运行程序的窗口(比如word)。
而此隐藏的后台进程分裂为三个互相保护。该软件的客服在其官方网站的技术支持论坛上表示:“采用程序管理器强行关闭进程并不能终止绿坝-花季护航的运行,这次关闭之后,重新打开程序管理器,还可以再次看到程序进程。”业界称之为“伪关闭”技术。
“这样一款小公司开发的软件会不会存在安全漏洞,一旦被黑客发现,则所有安装绿坝的电脑都成为黑客的‘肉鸡’,如果其安装量大的话,完全有可能重演‘暴风影音断网’的事件。”一份在互联网上广泛传播的“绿坝-花季护航测试报告”分析说。
谁来负责
“本产品可以过滤互联网上的不良信息,但不保证能(注:原文如此,此处“能”为多余)不良信息能完全被过滤,也不保证被过滤的信息完全是不良信息。”绿坝-花季护航在“最终用户协议”中的条款里这样写道,同时还有,“按本《协议》不对因使用本软件所产生的任何经济、法律纠纷承担任何连带或赔偿责任。”
这被网民称作绿坝-花季护航的“免责条款”。如果仅仅是一款商业软件,人们或许不会在意,然而现在它将成为7月1日之后中国境内销售的所有计算机的必带软件,成为由国家权力“背书”的一款软件,接下来必然会面临造成损失谁来承担的问题。
一位业内人士称,绿坝-花季护航软件是悄悄在后台运行的,如果用户不知情的情况下,在word等软件下输入文档,绿坝-花季护航有可能会将一些语句误判为“不良信息”,随即会毫无提示,自动关闭,给用户造成损失。或者是通过网页写邮件的时候,被软件误判而导致发不出去。
这个文档或者邮件如果涉及重要商务活动,因此造成巨大经济损失,这时谁来负责?
绿坝-花季护航软件最初是针对青少年的,相对来说涉及的经济损失会较少。现在由国家“背书”成为全社会强制应用的软件,会对包括商业用户在内的亿万用户日常操作有深刻影响的软件,这个过程中,政策的推行者应该有更周密的考量、更严谨的规范才是。
另一方面是,政策规定7月1日后“所有计算机”都要预装该软件,但记者询问客服后证实,目前“绿坝-花季护航”只支持Windows系统,还无法支持苹果、Linux等其他操作系统。那么7月1日后其他系统的计算机怎么办?这也对政策的严谨性提出了挑战。
远程告知?
实际上,2006年2月,原信息产业部提出的“阳光绿色网络工程”中,就明确提出要制定《基于PC终端的互联网内容过滤软件技术要求》和《基于PC终端的互联网内容过滤软件测试方法》(以下简称 “技术要求”和“测试方法”)。当年8月,两标准分别完成制定。而此次国家采购的两款软件,就是依照这两个标准进行的验收。
根据工信部网站公布的“技术要求”,符合国家标准的“基于PC终端的互联网内容过滤软件”,必须具备“远程告知”功能和“远程控制”功能,远程告知功能要求,访问符合设定过滤条件的网址或内容时,自动形成告警并通过邮件或短信形式告知管理员。而远程控制功能则要求可远程察看日志或者远程修改过滤软件的过滤设置等。
截至发稿时为止,记者未能联系上负责此次评审的机构,无法得知此两款软件是否完全满足国家技术标准。
据记者了解,郑州金惠计算机系统工程有限公司董事长名叫周慧琴,以前是中科院下属北京科海集团的党委书记兼常务副总裁,1997年参加国家科技扶贫工作组从北京来郑州组建“郑州金惠计算机系统工程有限公司”。
金惠公司近年来连续获得政府采购大单,并承担多个国家级项目,多与网络过滤系统有关。
另一家公司北京大正语言知识处理有限公司更是源远流长。这家公司由海淀区和中科院声学所联手创办,目前已经是完全民营性质。其主要产品,是将中科院声学所所长前黄曾阳的“HNC概念层次网络"的计算机语言识别理论产业化。
检索该公司网站的发展历程和承担项目等各项,大正公司的所有研发项目和产品,都是承接政府项目,或为行政管理开发产品。信息产业部电子信息产业发展基金、国际发改委发展基金、科技部国家科技攻关计划、863计划等等多个国家基金都对其研发项目进行了大力支持。
此次的”绿坝-花季护航“中的文字过滤软件,主要就是来自于北京大正的“花季护航”文字过滤引擎。是“HNC产业化的重要成果”。
据《光明日报》报道,数年前,一位全国人大常委会原副委员长把自己的学生陈小盟从深圳召回,一脸严肃:“我想同你商量一件事。我们要有自己的计算机语言处理系统,这不仅是一项科研,重要的是关涉到信息安全与国家安全。”
2000年底,陈小盟辞去北京麦纳科技公司总裁职务,带着1000万元投资,与中科院声学所合作注册成立了北京大正语言知识处理研究院,黄曾阳受聘担任研究院的首席科学家。
【南方周末】本文网址:http://www.infzm.com/content/29902绿坝评测报告
作者: 米兜
来源:南方周末网络专稿
1. 安装流程
1.1. 安装环境
操作系统:vmware workstation中虚拟中文windows XP+sp3
硬件环境:vmware workstation中虚拟内存512MB、硬盘8GB、奔腾4CPU3G
其他软件:windows XP默认安装组件、office2003、IE6
绿坝下载:http://www.lssw365.net/download.php?type=1&version=0 标准版3.17
“绿坝-花季护航”可供下载的有标准版、渠道版、网吧版、校园版和厂商版,测试版本为“绿坝-花季护航标准版3.17”。
1.2. 安装过程
下载完毕后双击文件LH-setup3.17.exe,进入安装界面绿坝安装界面
安装过程中发现一个语法错误,软件许可协议中的第一条“本产品可以过滤互联网上的不良信息,但不保证能不良信息能完全被过滤,也不保证被过滤的信息完全是不良信息。”,应该是“但不保证不良信息能完全被过滤”。软件许可协议
安装后会提示初始化密码112233,并且提示需要重新启动电脑
1.3. 安装后环境
安装期间无需指定安装的路径,相关文件会拷贝到windows目录和windows/system32目录下,注册表和文件的变更情况如下:
l 注册表删除记录:6条,都是删除原有在注册表内的ie浏览器历史记录
l 注册表改动记录:40条,大多数和网络连接的服务相关如修改mwsock.dll相关的多个键值
l 注册表新增记录:354条,主要是注册绿坝的软件信息
l 系统服务新增记录:2条,C:\Windows\MPSvcC.exe、HncEng.exe,不能在服务管理中改动删除
l 系统驱动新增记录:1条,C:\Windows\system32\Drivers\mgtaki.sys
l 系统启动项新增记录:1条,C:\Windows\system32\xnet2.exe
l 文件新增记录:27条,位于C:\Windows\内
87条,位于C:\Windows\system32内
2. 使用方法
2.1. 启动绿坝
安装后重启系统,在任务管理器中可看到由用户身份加载2项进程:XDaemon.exe和XNet2.exe,由系统身份加载2项进程:MPSvcC.exe和HncEng.exe。用户无需启动任何文件或进行任何操作,开机即进入绿坝的使用状态。另外,除HncEng.exe外的3项进程互相守护,不可单独关闭其中某一项进程,当打开被监控的程序,如IE浏览器,HncEng.exe就会自动加载。
2.2. 资源消耗状况
WindowsXP后台驻留的4个绿坝程序中
XNet2.exe 使用约27M内存
XDaemon.exe 使用约7M内存
HncEng.exe 使用约10M内存
MPvcC.exe 使用约3M内存
以上共约47M内存,在反复打开10次被识别为不良的页面后,以上4程序占用内存变化不大,维持在47M左右。
2.3. 设置界面
点击绿坝花季护航,即可进入系统设置界面,当无操作30秒后,会自动关闭界面,防止被误操作。
点击系统设置,会提示输入密码,就是初始密码112233,然后会提示进行免费注册,也点击“下次注册”跳过不进行注册
2.3.1. 系统设置
l 总控开关
n 可以全局设置绿坝的开关,也可以选择断开网络
n 可选项是:发现不良信息报警、允许白名单、只允许访问白名单、白名单优先
l 图像拦截
n 可以启动自动图像识别功能,并定义多少张不良图片会自动视为不良网页、列入黑名单、和自动关闭
l 语义分析
n 语义分析功能打开后软件会自动 网页及本地文字实时检查,如果发现不健康信息,将会对该浏览软件进行关闭
l 时间控制
n 控制可上网的时间段2.3.2. 个性参数
l 内容选择
列出了一批可选择的屏蔽内容类别,包括:成人/色情网站、成人/色情网站(严格)、暴力游戏、同性恋、非法活动/毒品。
l 个人定制
可自定义黑白名单,自定义关键字和禁止上网的程序
l 日志设定
设定日志的类型,可选择文字和图片,设定其记录的时间间隔和保存日志的时间
2.3.3. 日常维护
l 注册/升级
可手动进行更新升级,也可以设定更新的间隔天数。在注册信息内显示,软件授权至2010年05月20日
l 密码/卸载
可以修改系统密码,原密码112233非常简单而且现在全中国有上百万人知道这个密码了,正常使用绿坝的用户务必修改此原始密码。
绿坝并没有像一般软件那样在开始菜单有卸载的快捷方式,而是把卸载放在了软件的设置中。
l 界面/帮助
可选择不同的界面配色方案
l 网络修复
如果其他的病毒防火墙软件、网络防火墙软件、安全软件对绿坝有过影响或者删改,可以用网络修复。
2.4. 过滤效果
2.4.1. 30秒自动保护
在一边编写评测报告的同时,一边截图一边写,经常会遇到绿坝的系统设置界面自动消失,后来观测所得就是30秒内不对其设置界面有操作,就会自动的关闭。如果你需要再次打开设置界面,必须重新输入一次密码。
2.4.2. IE图片测试
测试环境下的IE版本是6.0.2900,在默认的设置下,打开图像自动识别低级的情况下,打开如下页面进行测试,并查看绿坝文字日志:
l http://www.voa.com,发现不良图片
http://www.voa.com/data/images/466/mediumlarge/Fourth%20Floor%20Corridor-people_Signature%20Theatre_8x10.jpg
l http://zh.wikipedia.org,发现不良图片
http://upload.wikimedia.org/wikipedia/commons/thumb/8/84/Song_Imperial_Examination.JPG/90px-Song_Imperial_Examination.JPG
l http://image.baidu.com,搜索关键字汤加丽,未发现不良图片,实际上在百度图片中会搜索到大量的裸露照片。
l http://jiao2.cn/ ,基本上图片都不能显示,而日志内并无任何记录,关闭绿坝后重新启动又恢复正常可以显示图片,在日志内发现关键字过滤。
再以我们常见的动漫图片来对比,分别是机器猫、hello kitty、加菲猫,同样在百度图片里面进行搜索,结果如下:
l 机器猫正常显示
http://image.baidu.com/i?ct=503316480&z=0&tn=baiduimagedetail&word=%BB%FA%C6%F7%C3%A8&in=4214&cl=2&cm=1&sc=0&lm=-1&pn=2&rn=1&di=782299440&ln=2000
l Hello kitty在读取页面显示了将近10秒后被关闭
http://image.baidu.com/i?ct=503316480&z=0&tn=baiduimagedetail&word=hello+kitty&in=5713&cl=2&cm=1&sc=0&lm=-1&pn=1&rn=1&di=484232084&ln=2000
l 加菲猫打开就把关闭
http://image.baidu.com/i?ct=503316480&z=0&tn=baiduimagedetail&word=%BC%D3%B7%C6%C3%A8&in=19313&cl=2&cm=1&sc=0&lm=-1&pn=15&rn=1&di=2801922136&ln=2000
测试结果发现:
l 绿坝会对大面积的黄色区域的图片敏感,对大块黄色块的图片也会有误判。如果是黑色、红色肤色的裸体图像,绿坝未能识别。
l 因为内建了白名单、黑名单、以及自定义过滤,所以是必然会有一个判断的优先级别。目前观测的结果是:在白名单内的域名,会一定程度上忽视自动识别,或者是降低其报警级别。例如在百度搜索的预览图片似乎不受图像识别影响。
l 文字日志记录不稳定,而且操作不方便,并不能自动刷新当前的日志,需要手动按刷新才行,不能准确的记录过滤不良图像的信息,尤其是有大量不良图像信息出现的时候。
l 当触动关键字时,可能会提高该页面的图像识别级别。例如jiao2.cn这个网站,代码里面有sex一词,结果该页面的图片显示就不正常。
l 当一个页面有大量图片,特别是超过30张以上的,当有图片被识别不良时,整个页面的其他非不良图片处理速度会变得非常缓慢,最后多数会全部图片不能显示,例如5aiba.cn这个网站的图片。
l 出现不良照片的网站,并不是每次都会提示信息后关闭,例如在baidu上搜索陈冠希***门的网站,大约几率在30%会提示不良信息后关闭,70%是直接关闭浏览器。
l 误杀无辜现象,例如在对比机器猫、hello kitty、加菲猫的案例中,会容易被认为是hello kitty、加菲猫被识别为不良图片,而实际上hello kitty的页面不是在打开的瞬间被识别后关闭,加菲猫的页面则是打开的瞬间被关闭。一个页面的加载是有顺序的,图像是一张张按代码顺序从上至下读取,而早已存在浏览器缓存中的不良图像文件,一读取就会触及绿坝迅速被自动关闭。
2.4.3. 文字过滤
l 在IE浏览器中使用某英文单词在维基百科英文版中搜索,日志中有记录发现关键词,没显示该具体的英文单词。该英文单词页面打开后,不是第一时间显示不良信息,在拖动翻页后大约3秒后显示不良信息,自动关闭了浏览器。
l 在绿坝系统设置中的个性参数中,添加个人定制自定义关键字,如“我爱麦兜“,然后在记事本中写”我爱麦兜“后存盘时提示不良信息,但是不良信息未能完全遮盖记事本的操作界面,此时可以存盘,然后再次打开该文件,会提示不良信息后自动关闭。再新建一个文件,里面再写”我爱麦兜“,然后存盘成功,关闭后再打开,未能即时提示不良信息,2秒后弹出不良信息提示。总结——文字过滤功能未能即时监控并提示。
2.4.4. 网络通讯
l 绿坝带有升级功能,可以通过在线升级获取新的白名单、黑名单、关键字库等,点击更新后,windows目录下属于绿坝的文件auctfil.dat、bsnlst.dat、gblfil.dat有改变。更新的网址为http://www.zzjinhui.com/softpatch/。
l 在windows/system32目录下属于绿坝的文件filtport.dat文件,记录了FreeGate/8567/tcp Urf/9666/tcp。
l 在windows/system32目录下属于绿坝的文件xnet2_lang.init文件,记录了一行“AOption0_1117=发现不良网站自动向金惠公司报告“,但是在操作界面中并无该项选项,不能确认该项的设置是否打开
l 金惠网用以支持绿坝更新的服务,是利用http文件检查版本,并用http下载的方式进行更新,用以支持http服务的是netbox服务组件,是国内一家公司开发支持asp的网站建设套件,netbox在2004年后就没有继续新版本推出。
l 6月10日19:54发现www.zzjinhui.com可能被黑客攻击,首页只有It works!字样。
l 无法继续测试在线更新功能,显示服务器错误404,404通常是http服务器提示找不到文件的代号。
2.4.5. 其他浏览器兼容性
测试FireFox、Flock、Safari这三款非IE浏览器时,发现切换绿坝的总开关,有出现无法判断不良图片的情况,以上三款浏览器可以安装插件过滤图片或特定文件,尤其发现绿坝对digg.com的js文件敏感。
在测试FireFox的时候,打开屏蔽digg.com的js文件,那么有个别原本被识别为不良的网站就可用顺利打开。可得出结论是,绿坝黑名单会较自动识别的判断更优先。
IE浏览器一般使用图片过滤或特定文件过滤的插件不多,非IE浏览器则有大量的过滤插件可供选择。绿坝在此方面应该需要改良,考虑如何避免用户屏蔽某些会被绿坝判别为不良的图像,而成功访问页面。总体来说,绿坝对IE的支持相对较其他非IE浏览器要好,如果用户只有IE浏览器,绿坝可以起作用,但要禁止用户下载其他浏览器和插件以绕开IE浏览器。
2.4.6. 视频识别
推测绿坝是通过访问浏览器的缓存文件实现图片的识别,如果一张图片是以幻灯片切换的方式或者是以gif的动画方式在页面上展示,实际上浏览器会把这些图片下载到电脑上的缓存内,则可被绿坝说识别。
而其他如flash格式的swf、flv文件,再如wmv、avi、rmvb等的视频文件则无法识别。
也就是说,绿坝不是监控屏幕显示,而是监控浏览器的缓存图片文件。如果不良图片是再也页面上实时绘画的,理论上也不能识别。
2.4.7. 加密保护
l Windows/system32内的文件uFWORD.dat记录了自定义关键字、uFUrl.dat记录了自定义过滤网址,可编辑。
l Windows/system32内的文件kwpwf.dll记录了绿坝系统设置密码,以MD5算法对密码进行加密存储,在注册表中也有记录该MD5加密后的字符串。2处都修改后就能更改管理密码。
3. 卸载删除
3.1. 卸载方法
在系统设置界面选择日常维护中的密码/卸载,点击卸载按钮,就会完成卸载,并且提示重启电脑。
3.2. 卸载后环境
无残留的系统服务、系统启动项,系统驱动mgtaki.sys需要手动删除。
【南方周末】本文网址:http://www.infzm.com/content/29952随机文章:
我们爱谷歌 2009-06-26《第一财经日报》特别报道:数着文明的伤口 2008-05-26宇文所安 田晓菲:旅伴是最好的一种关系 2007-11-22沃勒斯坦:“如今我们身处多极化的世界” 2007-11-05阿莫斯·奥兹:每一种爱都有黑暗的一面 2007-08-31
收藏到:Del.icio.us







