以关键词“知乎”为例探究文献计量规律在网络搜索指数中的实用性

2015-05-30 10:32贾诗琦
新经济 2015年12期
关键词:计量学定律百度

贾诗琦

摘 要:利用基于大数据背景的百度指数平台研究关键词“知乎”的搜索趋势,验证了信息计量学中的布拉德福定律和指数增长定律对网络搜索指数的适用性;并利用网络链接分析比较百度知道,知乎,quora三个网络问答平台的发展情况。

关键词:网络信息计量学 网络链接分析 布拉德福定律 网络问答平台 实证研究

1、研究背景

网络信息计量学,是一门新兴的计量学分支学科,研究对象主要是网络上的信息资源,学科产生的时间虽然较晚,但是国内外学者对此已经形成了较多的理论探索,例如杨涛利用信息计量学对国内的20个大学网站进行了实证分析,赵蓉英利用网络信息计量学分析比较了C2C网站等。可以说,信息计量学从研究理论到实践都已经日趋成熟,不过也存在一些问题:

(1)适用范围仅局限在学术研究领域。

(2)研究方法不完善,检验标准不统一。

(3)对表象的研究较多,缺乏深层次的规律性总结。

尽管网络计量学还有不完善的地方,但它对网络环境中的信息计量分析贡献巨大。

网络问答服务是伴随着搜索引擎的诞生而存在的,从以Yahoo Answers,百度知道为代表的基于搜索引擎的问答模式到以Quora,知乎为代表的新一代社交问答服务,网络问答服务作为一种知识分享工具一直是用户们热衷使用的功能,是互联网服务中极为重要的一环。2013年,知识问答平台“知乎”的用户注册人数从40万飙升到400万,高质量和专业的问答使网络问答社区成为了一大热点;在2014年,知乎及知乎日报井喷般地充斥在各种社交网络。笔者试图利用信息计量学的方法研究关键词“知乎”搜索规律和网站“知乎”发展状况。本文将分为两部分展开,第一部分详细解读“知乎”的搜索趋势和规律,第二部分横向比较知乎,quora,和百度知道这三个网络平台的发展状况。

2、知乎的发展规律

2.1 数据来源

之所以选择百度指数中的搜索指数作为信息来源,原因如下:

1.百度作为全球最大的中文搜索引擎提供了百度指数的服务,百度指数以百度海量网民行为数据为基础,利用统计分析的方法,计算出和关键词搜索量成正相关的搜索指数。百度指数能够告诉用户:某个关键词在百度的搜索规模有多大,关注这些词的网民是什么样的,分布在哪里等;

2.在当下的web时代,用户获取信息,利用信息的主要方式是在搜索引擎上搜索关键词,笔者认为搜索指数可以反映知乎的发展状况;

3.知乎是一个中文知识问答网站,用户都用中文在网站上交流,利用最大的中文搜索引擎百度提供的搜索数据无疑可以最好地反映知乎的发展情况

2.2 知乎的搜索指数随时间的变化规律

分别用线性方程,指数方程和逻辑曲线对图像进行拟合,可以发现,指数函数和逻辑函数的拟合度一样高,都为0.972。

在信息计量学中,早在1949年,普赖斯就发现一叠叠的(十年一叠)的《哲学汇刊》靠墙竟堆成了一条完美的指数曲线,并在此基础上,分析了大量统计资料,以科学文献量为纵轴,以历史年代为横轴,把不同年代的科学文献量在坐标图上逐点描绘出来,十分近似地表征了科学文献随时间增长的规律,提出了著名的普赖斯曲线。然而,普赖斯所提出的指数曲线也存在很大的局限性,由于普赖斯没有考虑文献老化的因素,也没有排除所研究文献的学科和时间影响,后面的研究者如Menard认为文献的增长是分阶段的,每一阶段的增长模式不同,第一阶段为稳定界——直线型增长,学科处于诞生期;第二阶段为增长界——以较快的指数型速率增长,学科处于发展时期;第三阶段为循环界—稳定和增长交替发生,符合逻辑曲线,学科处于成熟时期。

类似科学文献的的增长规律,网民对“知乎”的搜索量增长曲线也基本符合文献增长规律的三个阶段,与指数函数和逻辑函数拟合度一样高的原因可能因素是网站知乎还处在发展初期,网民对“知乎”的搜索热情还很高。

2.3 知乎的搜索指数在空间的分布规律

(1)研究思路与步骤

布拉德福定律是由英国著名文献学家B.C.Bradford于二十世纪30年代率先提出的描述文献分散规律的经验定律,描述了科学文献信息集中与离散分布规律,其文字表述为:如果将科技期刊按期刊载某学科专业论文的数量多少,以递减顺序排列,那么可以把期刊分为专门面对这个学科的核心区、相关区和非相关区。各个区的文章数量相等,此时核心区、相关区,非相关区期刊数量成 的关系。布拉德福定律的基本原理和方法是区域描述和图像描述。其数学表达式是论文累计数和按等级排列的期刊数量之间的函数关系。在实际研究中,很多研究者都发现布拉德福定律不仅适用于科学文献,还适用于很多不同的信息指标和对象。例如,D. P. Wallace就以期刊的被引次数来代替期刊的载文量,即认为期刊被引用的次数也可以像期刊的载文量一样直观地反映该期刊对于该专业的贡献大小和在专业中的地位。张洋通过研究也发现期刊web下载总频次也具有布拉德福的信息定律。笔者将按照布拉德福定律的原理和方法探讨网络环境下的搜索指数的空间分布是否也遵守布拉德福定律。

3、结论

(1)对关键词“知乎”在搜索引擎上的搜索指数的发展和规律符合信息计量学的基本规律。说明了布拉德福定律和文献增长规律在网络环境下,对搜索指数的实用性。拓宽和验证了信息计量学基本定律的应用范围,也对搜索指数的现象和规律做出了归纳总结。不过本研究仅仅探究了一个关键词随时间和空间的变化规律,并没有进行多关键词的比较,也没有揭示出现象背后的深刻原因,还有很多不完善的地方。

(2)通过横向比较百度知道,知乎,Quora三个知识问答平台在Alexa和Ahrefs上的指标,分析出百度知道由于其平台的开放性,内容的大众化,发展的成熟化,在网络影响力方面比知乎和Quora要高。而Quora虽然国际排名高于知乎,但其网络影响因子和站外/站内链接数都比知乎低,说明知乎的发展潜力巨大,影响力广,也说明Quora的内部交流和内部机制更完善。

(3)在研究的过程中,笔者发现网络计量学的分析工具和评价指标目前仍然没有统一和完善的标准,方法和工具上的不完善会影响网络计量学发挥其应有的作用。因此,开发一个专业的网络计量分析工具,确定统一和完善的网络计量分析标准,是目前人们需要解决和研究的问题。

猜你喜欢
计量学定律百度
生物化学计量学原理在离散生物动力系统的应用
针刺治疗失眠症的文献计量学分析
Robust adaptive UKF based on SVR for inertial based integrated navigation
多一盎司定律和多一圈定律
倒霉定律
百度年度热搜榜
基于科学计量学的公安院校科研与评价
百度医生
2004-2013年中医药治疗性早熟的文献计量学分析
百度“放卫星”,有没有可能?