彭美红
(福州外语外贸学院 大数据学院,福建 福州 350028)
中国互联网络信息中心(CNNIC)发布的第49 次《中国互联网络发展状况统计报告》显示,截至2021 年12 月,我国网民规模达 10.32 亿,互联网普及率为 73.0%[1]。随着互联网的发展,各企业建立了自身的网站,为企业宣传和产品推广起到了促进作用。然而,各网站在自身的影响力方面存在着较大的差距,有些是“门庭若市”,有些却是久久“无人问津”。对网站的影响力进行评价,从而发现问题并加以改进,是促进网站建设的必要路径。本文将在借鉴现有相关研究的基础上,利用链接分析的方法,对部分B2C 网站的影响力进行评价,以期改进网站建设并为相关研究提供参考。
链接分析法是利用搜索引擎、网络爬虫、数学统计等工具,借鉴传统引文分析的方法,对网站的链接特征进行分法[2]。借助该方法,可以评判网站的影响力。
目前该领域已有学者进行了相关的研究。将链接分析用于企业网站评价,在国内较早的是沙勇忠等学者[3],借助内部链接数、外部链接数、总链接数、网页数、来自某域的外部链接、在某时间区间更新过的链接等指标,对当时国内信息化优秀网站的影响力进行分析、评价和排名。其后,宋丽丽[4]、聂进[5]、史昱天[6]等学者对中小企业网站、网络借贷平台、网络直播平台采用链接分析的方式对其综合影响力进行了评价。综观现有的文献材料,可以发现,当前的链接分析研究应用于企业的较少,运用于B2C 网站的则更少,存在较多的研究,结论较简单,对网站改进与影响力提升不够,甚至有些研究只开展评价,而没有评价进行分析总结。另外,当前的研究各学者都从自身的认识设置相应的评价指标,导致有些指标虽内涵相差不大,名称存在差异,存在着误导性。如,有些文献链接分析使用“网站入链”“网站出链”,而另一些文献又使用“外部链接”“反向链接”“内部链接”等,也存在一些文献设置的指标在当前网络环境下不太合理,例如“类似网页数”。
结合现有的文献材料,针对上述存在的一些问题,本文以部分B2C 电子商务网站为研究对象,应用链接分析,评价它们的影响力。
本文研究在国内手机品牌中随机选取6 个品牌的电子商务网站作为研究对象。具体的研究对象,如表1 所示:
表1 本文研究对象
对现有的文献进行梳理可以发现,链接分析目前主要采取的指标包括网页总数、链接总数、内部链接数、外部链接数、网站日均访问量、反向链接数、网站日均页面浏览量网络影响因子、外部影响因子、百度权重、PR 值等[7-8]。对这些指标进行深入分析后,本文认为有些指标可以去除。
(1)网站影响力主要是对外的影响力,而内部链接数表示的是网站内部的结构,且又因其无法准确测得。另外,链接总数是根据内部链接数与外部链接数计算而得,也无存在的必要,可考虑删除内部链接数与链接总数指标。
(2)网络影响因子是根据链接总数/网页数计算而得,因链接总数没必要存在,可考虑将该指标删除。
(3)外部链接数与反向链接数含义类似,都表示来自外部的对网站的链接。因此可以考虑仅留其中一个纳入指标体系中。
(4)PR 值主要用于Google 搜索引擎,鉴于国内无法使用该搜索引擎,可考虑将该指标删除。
另外,当前手机用户在企业网站总市场份额中占有相当大比例,故可以增加移动权重指标。
综合上述分析,针对前文“相关研究”中提及的现有研究存在的问题,在确定指标时尽量采取规范的名称,并对相应指标进行认真严格地取舍。最终确定的评价指标如表2 所示。[9-10]
表2 评价指标及其含义
搜索引擎和网站统计工具是当前链接分析的重要工具,鉴于国内市场占有率及其稳定性等因素,本文选取百度(baidu.com)搜索引擎、站长工具(tool.chinaz.com)、alexa(alexa.cn)作为数据获取工具,相关工具的使用如表3 所示。
表3 相关工具的使用方法
使用上述研究工具,对表1 的B2C 网站进行查询,得各指标的数据值如表4 所示。
表4 各手机网站指标数据值
其中,网页总数的数值为site:abc.com 与site:www.abc.com 二者间更大的那个值,外部链接数也按此方法取值。
鉴于灰色系统理论在解决信息不确定情况下的多属性问题决策上的优势,本文将灰色关联分析方法引入到网站的影响力评价中,将主要包含数据标准化处理、计算指标权重、网站影响力计算等步骤。
由于各指标数据量纲存在不同,须对数据进行标准化处理。其公式为:
其中,n 为研究对象的数量(本文为6),xi(j)表示第i 个手机网站第j 个指标的标准化数值,i={1,2,3,…,n},j={1,2,3,…,m}(m 为指标项的个数,本文为7);xij表示第i 个手机网站第j 个指标的数值;max{x1j,x2j,...,xnj}表示第j 个指标的最大值;min{x1j,x2j,...,xnj}表示第j 个指标的最小值。
采用熵权法计算各指标权重。熵是系统无序程度的一个度量,对于某项指标而言,熵值越小,指标离散程度越大,该指标对综合评价的影响(即权重)就越大。熵权法的计算过程如下:
(1)计算第j 项指标下第i 个手机网站的得分值的占比pij,计算公式为:
其中,n=6,i={1,2,3,…,n},j={1,2,3,…,m}(m=7);
(2)计算各项评价指标的熵值,计算公式为:
(3)计算信息熵的冗余度 dj,计算公式为:
dj=1-ej
(4)计算各指标权重,计算公式为:
其中,j={1,2,3,…,m}(m=7);
依照(2)-(5)的计算公式得,各指标的权重如表5 所示:
表5 各指标的权重
通过加权灰色关联度来判断网站的影响力,其计算步骤如下:
(1)确定参加参考数值。设 x0(j) 表示第j项评价指标的最大值,将所有指标项的最大值组成的集合称为考数列 x0={x0(j)|j=1,2,3,...,m},比较对象 xi为各个研究对象。
(2)计算灰色关联系数,计算公式为:
经计算得灰色关联系数如表6 所示:
表6 各网站灰色关联系数
(2)计算灰色加权关联度,计算公式为:
其中,i=1,2,3,..,n(n=6);
经计算得各网站的关联度如表7 所示(按关联度降序排列)。
表7 各手机网站关联度排序
(1)网页总数及外部链接数是影响网站影响力的最重要的指标。由表5 可知,网页总数的权重为0.3264,排名第一;外部链接数的权重为0.1630,排名第二。关联度排序前三的VIVO、魅族、OPPO都有相对较高的网页总数和外部链接数。
(2)6 家手机网站影响力参差不齐,其中有1家关联度处于0.8 至0.9 之间,2 家处于0.5 至0.6之间,3 家处于0.3 至0.4 之间。从单项指标来看,各网站也存在较大的差距,例如VIVO 的网页总数达16000000,而努比亚的仅有 117000;魅族的DPV达2393000,而努比亚的仅有115000,说明各网站在整体实力或各具体指标上还有待加强建设。
为提升自身的影响力,各网站在需要做好以下几点:
(1)提高网站内容质量。内容质量对网站影响力的提高是基础,也是至关重要的。要从内容创新与价值、网页的布局、图片的选择、文字的描述等方面,强化网站内容质量建设。
(2)要加强网站外部链接的建设。外部链接数直接体现了网站被其他网站的认可程度,对提升网站价值有重要意义。在网站外链建设过程中,依然强调要注重网站的内容建设,同时也要注意网站的推广,通过软文推广、通信工具推广、邮件推广、广告投放等各方式宣传网站,提高网站的外部链接。
(3)做好搜索引擎优化工作。众所周知,用户访问网站基本入口普遍是搜索引擎,所以做好搜索引擎优化对各类网站的影响力提升有着重要的意义。搜索引擎优化是一项系统工程,不仅在网站建站时要注意使用对搜索引擎友好的技术,在运营维护时,也要注意提升网站对用户或对其他网站的吸引力。
本文构建了包括网页总数、外部链接数、百度权重、手机权重等7 个指标项的网站影响力评价体系,对6 家B2C 电子商务网站进行了评价,该研究为促进网站的可持续发展提供了理论依据与实践指导。