黄山青
(滁州学院 经济与管理学院,安徽 滁州,239000)
基于SPSS的高校网站网络影响力的实证研究
——以中国林业类高校为例
黄山青
(滁州学院 经济与管理学院,安徽 滁州,239000)
综合国内和国外对大学网站的网络影响力研究的成果,并且运用层次分析法和综合评分法确定各评价指标的权重,建立林业类高校网站的网络影响力评价模型,采用定性评价与定量评价相结合的研究方法对我国林业类高校网站做测评,得出我国林业类高校网站的网络影响力综合指数,同时利用SPSS软件对结果进行统计分析,通过聚类和因子分析,得出结论,从而对我国林业类高校网站有一个更加全面的认识。
林业类;高校网站;网络影响力;实证研究;
随着网络的日益普及,各个高校和科研机构也纷纷建立自己的网站,就是为了提供一个便于快速交流的网络平台,各个高校之间就可以方便的进行教学管理、学术交流和技术探讨和研究,也可以使广大学生以及社会相关人员更快捷、更便利地掌握有关学术、技术以及各个高校和科研机构的信息。为了更好的利用高校网站扩大其影响力,就需要对它们的网站的网络影响力进行评价研究。尽管如此,对于高校网站的网络影响力的研究,目前不是很多,特别是关注度较低的专业类高校,比如说林业类高校、农业类高校。本研究主要是通过SPSS软件来实证研究林业类高校网站的网络影响力[1-2]。
根据教育部对林业类高校的界定[3],本文研究中选取的样本如下表1。表中包括研究对象的名称,所在地,研究对象是不是211高校,研究对象是不是本科院校,研究对象网站的主页域名[4]。在本研究中我们只要用到的是各院校的网站主页域名。
表1 选取的样本Table 1 Selected samples
续表
院校名称所在地是不是211院校性质院校网站主页山西林业职业技术学院山西否专科http://www.sxly.com.cn/辽宁林业职业技术学院辽宁否专科http://www.lnlzy.cn/黑龙江林业职业技术学院黑龙江否专科http://www.hljlzy.com/福建林业职业技术学院福建否专科http://www.fjlzy.com/江西环境工程职业学院江西否专科http://www.jxhjxy.com/广西生态工程职业技术学院广西否专科http://www.gxstzy.cn/甘肃林业职业技术学院甘肃否专科http://www.gsfc.edu.cn/黑龙江生态工程职业学院黑龙江否专科http://www.hfmc.net/湖北生态工程职业技术学院湖北否专科http://www.hb-green.com/云南林业职业技术学院云南否专科http://www.ynftc.cn/安徽林业职业技术学院安徽否专科http://www.ahlyxy.cn/
根据文献中的网络影响力评价模型,涉及网站网络影响力指标有很多[5],本文结合高校的特点,根据以往研究者的研究成果,把指标归纳为访问量指标、可见度指标和链接指标,在每个指标下面又有更为详细的指标,从而建立一个三级层次评价指标体系模型[6],根据上述研究,将高校网站的网络影响力指标体系作为目标层(A),将访问量指标等作为准则层(B),将访问人数、网站的网络可见度等作为选择的方案层(C),建立林业类高校网站的网络影响力指标多级递阶结构模型[7],图1。
图1 高校网站的网络影响力指数的指标体系层次结构模型Fig.1 System hierarchical model of the network influence index of the university website
采用层次分析法对各个指标进一步进行处理,建立指标体系层次结构模型[8],利用图书情报学相关研究领域的专家对各个指标的权重进行赋值,得出每个指标的最终权重[9-10],如下表2。
表2 网络影响力指标的权重Table 2 The weight of the network impact indicators
从表2中可以知道访问人数、网络影响因子和可见度指标所占的权重较高,而访问人数和页浏览数权重较小,即对网络影响力的作用较低,这和以往相关研究中把网络影响力作为研究唯一因素在某种程度上是一致的。
利用Alexa,Altavisa,Google和baidu这些工具和相关方法来获取原始数据[11]。
3.1、访问人数(H)、人均访问页面数(IV)、页面浏览数(PV)和入链网站数(E)等指标数值可以通过Alexa获取。
3.2、入链网页数通过Altavisa或Google的“link”获取。方法: L1=linkdomain:baidu.com AND NOT host:baidu.com(以百度(baidu)为例),选用数值大的作结果。
3.3、可见度通过利用Altavista和baidu的“site”或“domain”获取。方法:可见度=domain:baidu.com 或=site:baidu.com。用这两个工具中较大的那个数据。
3.4、网络影响因子(WIF)可以通过上面的几种数据的获取计算出来,WIF=L/D。
3.5、数据的无量纲化。由于指标体系中所包括的各个指标具有不同的计量单位,在构建综合指标时,首先应该统一这些指标的量纲,量纲不统一的主要缺点是可能扭曲各个变量之间的相对重要程度。
本文的具体方法为:
首先,把每项指标中值最大的数据作为1,其他的数据根据最大值按比例计算。
其次,将标准化后的数据与该指标的权重相乘,然后将这些指标值求和就得到各个样本的综合指数。
最后,为了更好的研究各个样本的综合指数,把最终的综合指数乘以10000,取四位小数,从而得到网络影响力的综合指数终值[12]。
根据上述的方法,对研究对象的进行数据获取,得到原始数据(数据检索时间为2012年7月22日的6:30到7:15)。在得到原始数据的基础上计算出每个样本的WIF。
根据原始数据,在依据上面的数据的获取方法,调整数据,主要是标准化数据——数据无量纲化,把其中的一些数据(H,PV,WIF)小数有效位取为6位。
再根据调整后的数据和网络影响力指标体系的计算方法,其实这个步骤就是回归,它的线性回归方程:
综合指标=0.3031H+0.0578IV+0.1324PV+0.0923E+0.0508L+0.1958D+0.1677WIF,
也就综合指标受到访问人数(H)、人均访问页面数(IV)、页面浏览数(PV)和入链网站数(E)、入链网页数(L)、可见度(D)和网络影响因子(WIF)的影响。从而出我国各个林业类高校网站网络影响力的综合指标,如下表:
表3 综合指标表Table 3 Consolidated indicators table
(H为访问人数,IV为人均访问页面数,PV为页面浏览数,E为入链网站数,L为入链网页数,D为可见度,WIF为网络影响因子,以下各表中同)
利用SPSS软件对测试结果进行聚类和因子分析[13]。
(1)聚类分析
利用系统聚类法来对本文中相关数据进行聚类分析。首先,我们根据各个林业类高校网站的综合指标对高校进行聚类,系统聚类法对三个观测值进行聚类分析。为了更好的利用SPSS统计软件,对相关数据进行了处理,比如说是不是211,本文中1为是0为不是。
经过数据录入和SPSS聚类分析,输出结果显示样本都是有效的,输出结果为:
表4 聚类分析的类成员表Table 4 Cluster membership
续表
案例3群集2群集133214321532163217321832
由表5可知,当聚成3类时,北京林业大学和东北林业大学为一类,南京林业大学、浙江农林大学、中南林业科技大学、西南林业大学和浙江农林大学天目学院为一类,其他的大学为另一类。当聚成2类时,北京林业大学和东北林业大学为一类,其他的大学为一类。通过综合考虑网站网络影响力综合指标以及大学类型的聚类可以发现和现实实践中的情况非常吻合[14]。
(2)因子分析
从表4中我们可以看出有些数据有共性,因子分析就是要得出那些因素是同类,是可以用一个因子来代替几个因素的。从前面的分析和WIF的计算公式可知,我们那些影响网站网络影响力的因素,有共线性。所以本文对一些因素进行因子分析。
通过SPSS中的因子分析,得出各个变量时独立的可以进行因子分析,分析结果如下:
表5 主成分表Table 5 Total variance explained
提取方法:主成份分析法.
表5中列出了所有的主成分,且按照特征值的从大到小次序排序。从表中可见,第一成分特征根为3.982,方差贡献率为56.88%,前两个主成分的累计贡献率为81.832%,根据提取因子的条件——特征值大于1,本文选出两个因子。
表6 因子负荷矩阵Table 6 Component matrixa
提取方法:主成份分析法.
已提取了2个成份.
表7用来反映各个变量的变异可以主要由哪些因子解释。通过这个矩阵就可以给出各变量的因子表达式(假设两个因子变量为F1和F2):
ZH=0.958F1+0.151F2
ZIV=0.115F1+0.834F2
ZPV=0.932F1+0.250F2
ZE=0.965F1+0.113F2
ZL=-0.328F1+0.570F2
ZD=0.907F1+0.057F2
ZWIF=-0.566F1+0.790F2
这些公式和表6中,每个数据表示了相应因子变量对应原变量的相对重要程度。
表7 因子得分系数矩阵Table 7 Component score coefficient matrix
提取方法:主成份分析法.
由表7可知用回归法得出因子得分表达式,也就是因子得分函数的系数,根据它可以写出以下的因子得分函数,如下所示:
F1=0.24ZH+0.029ZIV+0.234ZPV+0.242ZE-0.082ZL+0.228ZD-0.142ZWIF
F2=0.086ZH+0.477ZIV+0.143ZPV+0.064ZE+0.327ZL+0.033ZD+0.453ZWIF
表8 因子得分的协方差矩阵Table 8 Component score covariance matrix
提取方法:主成份分析法.
从表8可知,由于因子得分的协方差为单位矩阵,说明提取得两个公因子之间是不相关的。到此SPSS的因子分析结束,下面对所得结果进行分析。
从上面结果得出,由7个变量,经过因子分后得出2个因子变量,利用2个因子变量,可以计算出每个高校网站的网络影响力的综合指数。这里,我们用这2个因子变量的方差贡献作为权数,于是得到下面的计算公式:
综合指数=0.5688F1+0.24952F2
按照这个公式,也可以计算出这些学校网站的网络影响力的综合指数。
根据上述分析,基本上可以将7个变量按照载荷分成两类,可以结合相关知识给各因子命名,其中第一因子中ZH、ZPV、ZE、ZD,这些变量反映链接特征的网站规模情况,就称用户链接因子。第二因子中有ZIV、ZL、ZWIF,大学网站的信息资源外部利用程度,也就是网站的吸引力,就称网站吸引力引子。可以按照这个公式分别计算出18个研究对象的网络影响力的综合指数。
[1]Almind T C, Ingwersen P. Informetric analyses on the World Wide Web: methodological approaches to“Webometrics”[J]. Journal of Documentation, 1997, 53 (4): 404-426.
[2]程妮. 中国科学评价研究中心首次发布“中国重点大学网络影响力排行榜”[J]. 评价与管理,2008(03):78-79.
[3]百度百科.高等学校[EB/OL].(2012-01-27)[2012-07-03].http://baike.baidu.com/view/17407.htm.
[4]新浪教育.高校院校库[EB/OL].(2012-01-01)[2012-07-03].http://kaoshi.edu.sina.com.cn/collegedb/collegelist.php?type=林业&dpc=1.
[5]吴茵茵.网络影响因子实证研究:基于不同搜索引擎的大学网站影响力分析[J].图书情报工作, 2005(4):107-111.
[6]段宇锋,刘伟. 电子政务信息资源网络影响力评价指标体系研究[J].情报资料工作,2006(1):43-46.
[7]曾荷.电子政务信息资源的网络影响力评价研究[D].上海:华东师范大学,2007.
[8]许树伯.实用决策方法——层次分析法原理[M].天津:天津大学出版社,1988.
[9]汪应洛.系统工程理论、方法与应用[M].北京:高等教育出版社,2005.
[10]层次分析法.yaahp[EB/OL].(2012-06-15)[2012-07-20].http://www.jeffzhang.cn.
[11]百度百科.AltaVista[EB/OL].(2011-07-11)[2012-07-22]. http://baike.baidu.com/view/93295.htm.
[12]沈固朝.网络信息检索-工具、方法、实践[M].北京:高等教育出版社,2004.
[13]卢纹岱.SPSS统计分析(第四版)[M].北京:电子工业出版社,2010.
[14]搜狐教育.中国大学排行榜[EB/OL].(2012-02-01)[2012-08-14].http://learning.sohu.com/dxphb/.
Empirical studies on the network influence of university website based on SPSS——with forestry universities in China as the example
HUANG Shanqing
(Chuzhou University,School of Economics and Management,Chuzhou,239000,China)
Comprehensive the outcomes of domestic and abroad on university websites network influence,use hierarchy analytic process and the comprehensive score method to determine the evaluation index of the weight.Establish the evaluation model of the forestry college website’s network influence.And use qualitative evaluation and quantitative evaluation methods to evaluate.forestry universities website in china.Drawn a network influence composite index for China’s forestry class university website.The results were statistically analyzed by SPSS software,cluster and factor analysis.Thus,we have a more comprehensive understanding for China’s forestry class university website.
forestry category;university website;network influence;empirical research.
1672-7010(2017)01-0052-07
2017-01-27
黄山青(1987-)男,安徽蚌埠人,实验师,硕士研究生,从事管理科学与工程研究,E-mail:heartseahuang@163.com
TP393 < class="emphasis_bold">文献标志码:A
A
课题资助:安徽省高校人文社科研究一般项目(sk2016B11);横向项目(HX2016094)