记者/文白
批量造假
谁是中国最好的网站,谁也说不清楚。公众上网的直接感受与各种机构的排名评比,大相径庭。原本,中国互联网络信息中心(CNNIC)关于“中国互联网发展状况统计报告”,相对具有权威性,赢得公众一定信赖,但CNNIC在6月的新一轮调查与评选中,发生了一连串触目惊心的舞弊事件,既败坏CNNIC的名声,也丧失公众信任。
自1997年起,CNNIC每年两度公布“中国互联网发展状况统计报告”,同时公布由网友投票产生的中国网站排名。今年CNNIC将调查分为两个阶段,第一阶段由网民如实填写关于互联网应用情况的调查问卷,以获得参加活动的用户名和口令,已于6月5日结束。第二阶段是正式评选,于6月12日开始,只有获得用户名和口令的用户才有资格参评。
此次中国互联网用户调查问卷于5月22日至6月5日放置在CNNIC网页上,几乎所有网站均对此进行了链接。北京、上海、广州三地的户外广告早在两个月前就被订购一空,7月份又大半撤出,直接目的就是取得一个好名次,即使是暂时的。
舞弊从“问卷”开始,在一些公司由一个“独立小组”完成。发动员工统一填写调查问卷是最直接的手段,然后把每一个员工变成一个“雪球”,利用各种社会资源把“雪球”不断滚大。有的网站层层下达指标,发动各地办事处拉选票,并为此特拨预算几百万。还有网战的CEO像“美国总统竞选”一样,坐着飞机到处转,演讲发礼物,“请投我一票”。
对于一个编程员来说,对CNNIC的调查问卷进行技术上舞弊并非难事,几天就可以编出一套“舞弊程序”。一位不愿透露姓名的编程员称:在1999年7月,他所在的公司就已编好“投票程序”。两个人花了三天写完。公司还明确指示,密切关注并分析CNNIC可能采取的加密方式,快速解密。
一些大学生成为舞弊的帮凶,填一份问卷可获2元报酬。据上海记者调查,复旦大学内公开贴有此类“招聘启示”,有一种说法,发到复旦的问卷有2万张。
利用学校社团的力量更为有效,可以“批量造假”,因为是规模化生产,造假成本也大大降低,一份问卷1元钱。一家网站的上海分公司曾以5000元赞助费的价码,要求一所高校学生会造假5000封问卷。
学生们只要把自己的身份证号贡献出来,其他的事情都由网站来操办,这是CNNIC评选中最常规的舞弊方式。一家中等规模的专业网站市场部人士说,他们这些普通职员的任务是每个人完成50张选票,“头儿可惨了,要完成1万张”。
鉴于上海是“重灾区”,CNNIC信息部主任杨风雷公开表态:“我们会密切留意来自上海的选票”。
集体舞弊
新浪网连续两次在CNNIC评选中“排名第一”,其中国区总裁汪延在获悉舞弊事件后深感悲哀:“这种事情的曝光,就好像网站脱了裤子示众:看看我有多丑陋!”作为业内人士的汪延早已嗅到舞弊之气。他透露,不少同行对作弊已心照不宣,到校园拉选票已经赤裸裸,一些网站并不讳言让员工搜罗身份证。
在网络业几乎无人不晓舞弊事实,可怕的是大家习以为常,在业内将舞弊程度分为三类:靠一些不正当手段笼络不明真相者投票,只算是“小蒙”;网站的首脑们亲自拉选票,并承诺一些“优惠服务”只是“中骗”;真正的“大盗”是明目张胆地花钱买选票,甚至从保险公司弄来身份证号码。
“大家都这样做”,成为人人都舞弊的最恰当理由。CNNIC评选最终导致公开的集体舞弊,而且这种作弊已经进入一种职业化阶段。
汪延认为:CNNIC的评选“变味了”。他说:“虽然主要责任不在CNNIC,但期望尽快有一个明确答复,游戏规则究竟是什么?”
无人监督
目前尚无明显证据说明CNNIC也卷入舞弊行为。CNNIC有关人士称,这是一个非赢利的管理与服务机构。CNNIC由信息产业部和中国科学院共同组建,其最大收入来源于“域名注册”,这是有关部门赋予它的管理权限,按理说机构运作不成问题。但值得一提的是,CNNIC的调查设计有没有严重缺陷,为什么“十佳网站评选”舞弊之风如此浩荡?
对于“十佳网站评选”惊爆舞弊内幕,CNNIC信息部主任杨风雷信誓旦旦:“一定予以制止”。但其自信的基础却显脆弱:1.即时跟踪等先进的技术;2.科学的统计学依据;3.处理方法。但杨风雷并未公开“先进的技术手段”与“科学的统计依据”是什么。至于“有办法排除绝大部分的舞弊投票”,人们已有领教,在去年的评选中,CNNIC共收到36万张选票,宣布作废16万张选票。
问卷返还率低与虚假填写,是传统问卷式调查的弊端。CNNIC的调查方式和手段不仅无法回避传统弊端,而且出现填写人身份是否真实的弊端,这是一种根子上的舞弊。
在传统问卷式调查中,为了保证调查的真实可靠,一般采取回访手段,如果发现回访问卷中出现20%以上的虚假问卷,将视为此次调查不成立。在1999年底,CNNIC的“十佳评选”中,共收回36万份调查问卷,当发现一些网站的舞弊行为后,CNNIC废掉其中16万份调查问卷。回收的调查问卷中,假票和废票高达44%,一方面可见网站舞弊之风太甚,一方面可见调查结果的不可靠。
废掉44%的选票,姑且算是CNNIC的认真,但好事者不依不饶,穷追细节。试问:1.CNNIC并未公布真假选票的标准,那么主办者完全可以自主选择而具倾向性;2.44%的选票被废掉说明在调查方案设计上的弊病,不科学的设计无法保证科学的结果;3.16万份假票和废票出现,证明CNNIC根本没有能力遏制造假,无以打假何以为真。
既然回访是保证调查问卷可靠性的保障,但CNNIC调查给自己留下的回访时间太短,评选的第一阶段为6月5日,第二阶段从6月12日开始,中间回访时间正好相隔一周。我们以绝对假设方式计算:一个回访员每天工作10小时,每个回访电话需要3分钟计算,7天只能回访1400份问卷;如果将36万份问卷回访1%,需要2.5个回访员,回访10%就需要25人,显而易见,CNNIC的回访率极低。
人们还注意到,CNNIC从未公布过“评选方案的标准”,也未公布“监督的第三方”,排名依据显得讳莫如深,无人监督调查结果显得缺乏透明。在方案设计上,忽略标准的科学性和监督的公开性,使调查的权威性大为受损,难逃“暗箱操作”之嫌。
CNNIC的毛伟说:针对现在一些网站拉选票的做法,诸如借身份证号等,CNNIC在技术上都可以“防范掉”。为了确保评比的公正性,他们将在最近公开这些技术,以让大家放心。同时,CNNIC公布对国内主要网站浏览量的排名,“两个排名综合起来会更全面一些”。
CIG总裁吴敏春认为,让网民投票评选最佳网站本身就因为缺乏科学性而造成“先天不足”,国际上目前通行的方法是聘请专业调查公司,借助专业软件,对某网站的在线信息进行监控与分析。
浮躁之风
CNNIC每6个月对网络状况的调查,曾被业界誉为“相对而言的最权威调查”。在基础数据(比如中国上网人数的统计)的调查同时,CNNIC还公布网站排名。CNNIC的数据被诸多网站频繁引用,比如,1999年获得第一的新浪,就在其宣传册上重重描绘了一笔;1999年获第二名的网易,在公司介绍上不忘提到“前两次调查第一名”的昔日辉煌;1999年排名第三的搜狐对CNNIC的调查结果颇为不满,不惜专门请全球著名的盖洛普调查公司重做调查,以此“第一”驳彼“第三”,说明张朝阳是在意CNNIC的。更值得一提的是,CNNIC的数据被中国政府部门广泛使用,甚至朱杌总理在政府工作报告中引用的也是CNNIC的数据。
这个排名的影响力越来越大,被许多网站视为向风险投资或者股票市场“交差”的重要指标。去年曾跌出30名的中华网,首席执行官叶克勇在京接受有关媒体采访时甚至声称,不做到前三名,无法向股民交待。更多的网站则希望得到一个靠前的名次,从而获得风险投资者的青睐。据说,因为风险投资是根据网站排名掏钱的,在看风险投资脸色过活的网站眼里,这无疑是致命的。
“单纯的排名没有用处”,目前国内最大风险投资商之一、日本软银中华基金首席代表石明春说:风险投资要看网站的实力、内容、团队等众多指标进行综合考虑,一次评比不能说明什么。
著名风险投资商、“水晶互联网风险基金”的执行董事曾焕哲指出,仅靠十佳排名根本“骗”不到风险投资,客户(注册网民数)、产品、收益才是他们考察网站、电子商务的三大标准。
“现在网站的心态太浮躁,找不到真正的商业指标对自己进行判断,只好依靠排名说事儿”,CNNIC主任毛伟说,对网站排名的过分看重,反映出中国网站缺乏底气。
新浪中国区总经理汪延说:“如此下去,CNNIC的评选对整个业界将失去意义。”他还指出,“舞弊事件说明中国网络经济还很幼稚。”
中国互联网业如火箭般窜起之后,烧钱之名声震其他行业,浮躁弥漫于大大小小网站。在纳斯达克发生雪崩后,年轻的CEO们浮躁心态又添一缕焦虑。用什么方式能够最大最快地吸引资本市场的注意力,成为CEO的头号问题。据业内人士说,此次舞弊行为最为露骨的网站基本是在资本市场门口排队的守望者。
排名:钱出数字,数字出钱。这不是中国互联网的捷径。