国内网络信息资源分布实证分析

2008-10-30 05:24陶慧卿
大学图书馆学报 2008年4期
关键词:域名站点数量

陶慧卿 庄 琦 潘 卫

摘要在信息经济社会发展的过程中,信息资源的分布不均衡产生了信息贫富差距。该文探讨了2001年至2005年我国网络信息资源的地域分布、时间分布、内容分布和行业分布,并对这种分布状况进行了实证分析。

关键词网络信息资源网络信息资源分布实证分析

根据最新的中国互联网络发展状况统计报告,截至2007年12月31日,我国国际出口线路总容量为368927Mbps(国际出口带宽衡量的是中国与其他国家或地区互联网连接的能力),较2006年的年增长率为43.7%。中国与国际互联网连接的能力进一步增强。其中,中国公用计算机互联网占198353Mbps,宽带中国CHINA169网占138887Mbps,中国科技网占8810Mbps,中国教育和科研计算机网占9052Mbps,中国移动互联网占8260Mbps,中国联通互联网占4319Mbps,中国铁通互联网占1244Mb-ps,中国国际经济贸易互联网占2Mbps。在这八大骨干网中,从信息资源的分布状况来看,中国公用计算机互联网、宽带中国CHINA169网、中国教育和科研计算机网、中国科技网的信息资源比较丰富,其他网络普遍存在着信息资源较少,没有搜索引擎、导航等问题。这八大骨干网络的信息资源结构与分布不均衡,从总体上存在着信息资源配置不合理的问题。

本文以中国互联网络中心公布的中国互联网络发展统计报告(2001年~2005年)和中国互联网络信息资源数量统计报告(2001年~2005年)作为数据来源,分别从网络信息资源的地域分布、时间分布、内容分布和行业分布进行实证分析,探讨国内网络信息资源分布存在的问题,并提出一些意见和建议。

1、网络信息资源的地域分布

网络信息资源的地域分布主要是通过占有IP地址的数量、记录等表现出来,因此,对全国域名分布、网站分布的分析基本可以看出网络信息资源在全国的地域分布情况。

1.1CN域名的地域分布

域名是网站的标识,网站是收集、整理、传播信息的集散地,从网站数量上可以看出一个地区的信息发布能力和信息资源占有能力。由于网站与域名是一一对应的关系,因此从域名的统计中可以看出国内网站建设发展概况以及各地区网站建设的差别。

(1)2001~2005年国内域名总量分布

从图1可以看出,除了在2002年度国内域名总量略有下降以外,从2002年至2005年国内CN域名总量呈明显上升趋势。

(2)国内域名地域分布差异

为了便于说明问题,这里分别统计了2001年至2005年国内CN域名分布数量最多的五个地区(下面简称前五名)和分布数量最少的五个地区(下面简称后五名),见表1和表2。

从表1和表2可以看出,国内的CN域名主要分布在北京、广东、上海等发达地区,西部省区域名数量少,占的比例也很小。虽然互联网在我国的发展只有几年的时间,西部地区在网站数量上已经远远落后于发达地区。

针对2001年至2005年CN域名数量分布的前五名和后五名,本文统计了前五名和后五名的各年域名的绝对数量,从而进一步分析比较二者的绝对数量在五年中的变化趋势,见图2。

从图2中可以看出,2001年至2005年前五名的域名数量呈显著上升趋势,而与之形成对比的后五名的域名数量虽有增加,但变化较为缓慢。由此可见,国内东西部信息分布差异有增大的趋势,东西部的数字鸿沟在不断扩大。

1.2网站地域分布

从网站数量的分布来看,国内的网站站点数量一直保持上升趋势。国内的www站点主要集中在北京、广东、上海、江苏、浙江等地区。2001年至2005年五个地区的网站站点数量在全国网站站点总量中所占的百分比分别为:57.8%、67.1%、64.9%、64.8%、62.8%。而西部地区的网站站点数量在全国网站站点总量中只占1~2%

(1)2001~2005年国内网站站点总量

从图3看出,随着国内的信息化进程,网站站点数量也在逐年增长,尤其是在2002至2003年,国内网站数量发展速度较为迅猛,表现出一个良好的发展势头。

(2)国内网站站点数地域分布差异

为了便于说明问题,也统计了2001年至2005年国内网站站点分布数量最多的五个地区(简称前五名)和分布数量最少的五个地区(简称后五名),见表3和表4。

从图4可以看出,2001年至2005年前五名的网站站点数量一直保持着良好的发展趋势,而后五名的站点数量虽有增加,但变化较为缓慢。地区信息分布差异呈现出扩大的趋势。

上述域名和网站站点数发展状况的分析共同反映出一个问题,即中、东部地区的域名数量、网站站点数的拥有量均居全国领先,西部地区已远远落后于中、东部地区。由此可见,国内网络信息资源的分布存在着显著的地域分布上的不平衡现象。据笔者分析,造成这种不平衡的局面主要有以下几个原因:

(1)网络信息资源在地域上的分布和该地区的经济、文化的发展有密切关系。网络信息资源主要集中分布在经济、文化较发达的地区。中、东部地区的网络信息资源丰富,而西部地区较贫乏。经济发达地区具备资金优势,而且传统信息资源较为丰富,在此基础上建设网络信息资源具有优势,其市场前景也比较好。西部地区由于经济、文化的相对落后及文献信息的相对贫乏,在网络信息资源建设上与中、东部省市比较起来表现出极大的差别。

(2)网络信息资源的分布和该地区技术人才的拥有量有很大关联。西部地区人才严重短缺,人才队伍不稳定,并且西部地区教育基础设施落后,无法给本地人才的培养提供一个良好的环境。在这种环境下,西部地区的网络信息资源建设不可避免地面临着困境。

因此,要想彻底改变西部地区网络信息资源匮乏,使信息资源的地区分布达到均衡的状态需要长期、大量的经费投入,以及专业技术人才的培养和输送。

2、网络信息资源的时间分布

网络信息资源的时间分布主要从网站成立时间、网页及数据库更新的周期表现出来。

(1)网站成立时间

根据2005年中国互联网络信息资源数量调查报告,2005年成立的网站占网站总数的47%,2000年及以前成立的网站占网站总数的7%,见图5。

从图5可以看出,截至2005年,国内大部分网站是在2004年和2005年成立的。

(2)网页更新周期

从网页更新周期情况看,2001年到2005年更新周期在一月以上的网页数量在当年更新网页总数中的百分比分别为:88.1%、93.69%、91.5%、62.8%、64.14%;而更新周期在一周以内的网页数量所占比率分别为:6.89%、1.81%、2.8%、10.4%、17.62%,见图6。

从图6可以看出,2001年至2005年更新周期在

一月以上的网页数量远远超过更新周期在一周以内的网页数量。这反映了国内网页的更新周期普遍较长,更新频率低。

(3)在线数据库更新比例

从在线数据库更新比例来看,记录的更新比例仍比较低。

从2001年至2005年在线数据库更新比例图(图7)中可以看出,大部分数据库的更新比例在1%~5%和1%以下,更新比例在20%以上的数据库比率只占10%~20%。

从网络信息资源的时间分布可以看出:大部分网站是在2004年和2005年成立的,这说明随着我国信息化进程的加快,信息资源数量在迅猛增长;但在网页的更新上,国内网站的更新周期普遍在一个月以上这说明信息更新不够及时,信息资源的时效性差;在数据库更新比例上,国内在线数据库的更新比例普遍在1%~5%,这同样说明了国内信息资源的时效性不高。而过时、陈旧的信息内容使信息资源质量下降,信息资源结构不合理,阻碍了信息资源的开发和利用。

因此,在推进信息化进程的过程中,我们不仅要注重信息资源数量的增加,同时要提高信息资源的质量,使其结构更加合理,从而充分发挥信息资源在国民经济建设中的重要作用。

3、网络信息资源的行业分布

从网络的组织结构可以看出信息资源主要分布在网站上,人们通过网址来查找和利用信息资源。根据网站的经营主体的性质,我们将网站区分为以下几类:政府网站、企业网站、商业网站、教育科研网站、个人网站、其他公益性网站以及其他网站等。由于发布信息的目的及所拥有的信息资源不同,导致不同机构所产生的网络信息资源存在差异。

政府网站所提供的信息资源主要有职能/业务介绍、政府公告、法律法规、政府新闻、行业/地区信息、办事指南、统计资料、电子政务等。我国政府网站上主要有以下三大类信息。(1)政策法规,几乎所有的政府网站都有相应的政策法规数据库。在政府网站上可以得到最新的政策信息、重要的政策法规全文,具有其他网站无法替代的权威性。(2)经济信息,许多政府网站提供经济信息,突出地方特色,为地方经济服务。如信息产业部的投资分析和市场研究专栏。(3)服务信息,政府上网为政府机关公开自身工作透明度提供一个方便、快捷、有效的载体,政府职能部门负责人、部门职责、办事程序在网上一览无余。

企业网站提供企业总体概况、产品与服务信息、商业服务信息、行业新闻、企业动态等信息。动态性信息为主,相对静态性信息为辅,信息更新及时。

商业网站提供新闻、网上社区、在线数据库、网上教育、电子商务、软件下载、电子邮箱、网上股票交易、网上订票等信息。商业网站提供的信息资源系统性、完整性较好。

大学、科研机构站点主要提供学术性较强的各种信息,而且相对企业来说变化较小。

个人网站是指个人或团体因某种兴趣、拥有某种专业技术、提供某种服务或为自己的作品、商品展示销售而制作的具有独立空间域名的网站。个人网站内容是介绍自己的或是以自己的信息为中心的网站,不一定是自己做的网站,但强调的是以个人信息为中心。

其他公益性网站主要是指各类信息机构站点。信息机构站点一般以提供各类专题信息为主,如经济类专题、科技类专题,以及各种专门类型的文献信息,如报刊、图书、专利、会议文献等。

2001年至2005年不同类型的网站数量在当年网站总数中所占比例见图8。

从图8可以看出,企业网站的比例最大,政府网站、商业网站、教育科研机构网站的信息资源建设有待加强。

政府网络信息资源建设需要加强,目前我国有大量的信息资源掌握在政府手中。而政府机构网站在网站总数中所占的比例不到10%,而且提供的信息内容不够丰富。因此,需要进一步加强政府信息资源建设,使政府信息资源在整个网络中占有更大比例。

各类信息机构的网络信息资源建设较薄弱,没有充分发挥其信息资源优势。信息机构丰富的印刷型、视听型、缩微型信息资源亟待转换成电子型,在网上建设一个拥有电子图书、电子期刊、电子报纸以及各种类型电子出版物的数字图书馆。

4、网络信息资源的内容分布

2001年到2005年在线数据库的内容分布见图9。

在线数据库的主要服务内容集中于政策法规、金融股票、报刊新闻、科技信息和产品信息等。从图9可以看出,产品信息在服务内容中所占比重分别为:59.6%、35.5%、56.7%、45.9%、61.0%。由此可见,我国的网络信息服务内容分布单一,信息资源的质量不够高。

随着科学技术日新月异的发展,社会各行业、各部门对信息的需求更加迫切,科技信息被认为是经济建设、科研、设计、生产、经营管理、市场营销中的关键环节,是社会发展的推动力之一。2001年到2005年,科技信息在所有在线数据库的服务内容中所占比重分别为:15.4%、11.9%、14.0%、7.7%、16.2%。与产品信息对比,我们可以看出,国内网络信息服务的层次偏低,对科技信息的重视程度不高,尚未充分发挥网络信息资源对国民经济发展的潜在优势。

根据中国互联网络信息中心对用户的调查,当问及网络信息中哪些还不能满足用户的需要时,回答中比例最大的依次为电子书籍,专业文献/论文,科技、教育信息,生活服务信息,新闻,计算机软硬件信息。可见,重视网络信息资源的内容结构层次,调整、优化其内容构成不仅是网络本身发展的需要,也是用户的迫切需求。

5、结论

综上所述,通过对2001~2005年国内网络信息资源分布的分析,我们看到国内网络信息资源已形成一定的态势和规模,但网络信息资源的分布不尽合理。在地域分布上,国内网络信息资源主要集中分布在中、东部地区,地区分布差异有不断扩大的趋势;在时间分布上,网络信息更新不够及时,信息资源的时效性差,阻碍了对信息资源的开发和利用;在行业分布上,网络信息资源主要集中于企业网站,政府网站、经济与科技信息网站等网络信息资源建设需要加强;在内容分布上,国内网络信息资源服务内容单一,缺乏特色资源,信息资源质量有待提高。因此,国内网络信息资源的分布亟待调整网络宏观结构,优化资源配置,从而充分发挥信息资源对国民经济建设的重要作用。

猜你喜欢
域名站点数量
基于Web站点的SQL注入分析与防范
统一数量再比较
2017~2018年冬季西北地区某站点流感流行特征分析
Combosquatting域名抢注的测量研究
如何购买WordPress网站域名及绑定域名
首届欧洲自行车共享站点协商会召开
怕被人认出
腾讯八百万美元收购域名
我国博物馆数量达4510家
顶级域名争夺战:ICANN放出1930个通用顶级域名,申请者有上千家