网络学习的网络时空关注度分析

2018-08-22 01:23:28吴涛张立敏
现代计算机 2018年22期
关键词:关注度百度趋势

吴涛,张立敏

(1.岭南师范学院信息工程学院,湛江 524048;2.广东省数字化学习工程技术开发中心,湛江 524048)

0 引言

《国家教育事业发展十三五规划》专门一章提出了“互联网+教育”的推进和发展问题,指出继续开展“网络学习空间人人通”,形成线上、线下有机结合的网络化泛在学习新模式,并引导学校与教师依托网络学习空间记录学生学习过程[1]。刚刚召开的中国共产党十九大也指出要以教育信息化推动教育现代化。某种意义上说,随着网络基础设施的完备和现代信息技术的发展,网络学习已经并将继续深刻变革着人们的学习方式。尽管如此,网络学习研究方兴未艾[2-4]。在这样的背景下,社会大众需要全面了解网络学习的概念、原理、技术和系统,并采用不同形式开展网络学习,网络学习本身作为关键词也必定逐渐成为网民关注的搜索对象之一。因此,针对网络学习的网络关注度研究具有非常重要的现实意义。

百度指数是以百度搜索中网民互联网行为数据为基础的数据分享平台[5],目前以被广泛应用于新闻传播、图书情报、旅游营销、公共管理等方面[6-10],并展示出一定的特色优势。本文选取“网络学习”作为研究关键词,以百度指数为研究工具,利用中文网民互联网行为大数据对网络学习的时空关注度进行了相关分析。本文的研究期望在某种程度上窥探我国网民的网络学习关注情况,为网络学习空间的建设、网络学习资源的共享、网络学习领域的发展等方面提供一定的参考和借鉴。

1 大数据来源与研究方法

互联网流量测量服务提供商StatCounter[11]每个月更新一次各种类型的统计报告以及网站流量统计结果。根据StatCounter公司在2017年10月公布的最新数据显示,百度一直以来都是全球最流行的中文搜索引擎,占全球中文搜索引擎市场份额约78.71%,其中近一年的详细数据如图1所示,百度稳居前列,占有2/3以上的市场份额,此外,360好搜、神马搜索、搜狗搜索等也占有一定的市场份额。

图1 搜索引擎市场份额图

基于上述占绝对优势的市场份额,百度研发了百度指数这一数据分享产品,提供从2006年至今的相关搜索关键词的网络关注度,包括用户关注度、媒体关注度两方面。其中用户关注度主要以海量网民的互联网搜索行为为基础,利用自然语言理解、数学统计等方法分析出关键词的搜索加权频次和,以各种维度可视化显示,可选设备有PC端、移动端,也可以从地域分布、人群属性等维度分别分析具体的搜索行为数据,默认包括的时间跨度有7天、30天、90天、半年和全部,当然,也可以自定义时间跨度。

鉴于以上两点原因,本文利用百度指数平台(网址:http://index.baidu.com),以“网络学习”为主关键词,“网上学习”、“在线学习”为辅助组合关键词,以“MOOC”、“远程教育”为对比关键词,获得了2011年1月1日至2017年10月25日的逐日网络关注度数据,进行了以下四个方面的特征分析。

(1)时间特征演化分析:本文首先生成了网络学习的网络关注度在全时段的整体演化趋势,其实,截取部分时段进行了有针对性的挖掘,包括近90天、近半年三个时间跨度,最后,还研究了在特殊时间段的网络关注度演化趋势,选取近30天、2017年春节作为例子进行了探讨。此外,在各个时间维度上都与“MOOC”、“远程教育”等对比关键词进行了比较分析。

(2)人群特征演化分析:百度根据用户搜索数据,采用数据挖掘方法,对关键词的人群属性进行聚类分析,本文由此生成了在网络上关注网络学习的用户人群所属的年龄及性别分布情况,结合网络学习研究的相关成果,对该人群分布进行了检验解析。同时,在各个人群特征维度上都与“MOOC”、“远程教育”等对比关键词进行了比较分析。

(3)设备特征演化分析:鉴于数据来源的不同,百度将搜索指数分为PC搜索指数和移动搜索指数。根据这一特点,生成了关注网络学习的设备入口分布情况,并剖析了PC端和移动端的演化趋势异同点。

(4)空间特征演化分析:百度根据用户搜索数据,采用数据挖掘方法,对关键词的人群属性进行聚类分析,本文由此生成了在网络上关注网络学习的用户人群所属的省份、城市及城市级别的分布及排名,结合网络学习的实际开展状态,对该结果进行了深入分析。

2 大数据分析结果与讨论

2.1 时间特征演化分析

从2011年1月1日至2017年10月25日这个时间段,用户关注度的时间特征演化趋势如图2所示,图中纵坐标为网络学习的网络用户关注度,横坐标为时间序列。总体上,网络学习的关注度相对比较平稳,整体搜索的平均值为776,用户搜索大多在850附近徘徊,但在细节上也存在很多毛刺,并非光滑曲线。此外,在2016年7月以来的一年多时间内,用户搜索行为呈现出较大幅度的波动,峰值约2000、谷值仅600。在全时段,近7天整体搜索指数880、同比下降30%,环比下降2%,近30天整体搜索指数823、同比下降29%、环比上升1%。

考虑到网民先验知识和认知水平的影响因素,选取“MOOC”、“远程教育”,在相同的时间段内进行了对比分析。为了便于比较,相关曲线也附在图2中。很显然,在三组关键词中,MOOC的整体关注度明显占优。相比而言,MOOC的概念提出相对较晚,大约在2013年初期正式有用户行为的记录,但是,直到2013年中期,MOOC的关注度开始高于网络学习、远程教育,虽有小范围的波动,并一直占有稳居三者中的首位。MOOC作为网络学习的一种方式,逐日关注度的指数均值达到了1700,远远高于网络学习的平均指数。某种程度上说明,网民对纯粹的网络学习概念、原理和技术的关注度并不高,大多数人更乐意使用网络学习形式,但缺乏对其本身的了解和认知。与之相反,虽然远程教育的平均指数高于网络学习,但整体趋势比较相似,考虑到远程教育的范围更大,提出时间更早,关注度更广泛也是情理之中。

图2 网络关注度的整体趋势

为了进一步窥探短期内的用户关注度,根据百度数据统计的近90天、近半年逐日搜索指数,获得了相关的时间特征演化趋势如图3所示。2017年7月25日至2017年10月25日,三者的指数变化趋势都比较类似,前期平稳、后期剧烈震荡,在10月初期呈现局部谷值。将时间跨度扩大,即开始时间提前到2017年4月25日,如图3(b)所示,如前所述的趋势更加显著,区别仅在于前期稳定的区间更大。因此,当三者的搜索关注度同时出现总体上先下行、后上扬的局部特点时,这非常有必要深入挖掘其中的原因。

图3 分时段的网络关注度趋势

基于前述分析,将时间跨度缩小到近30天,放大局部视角,对比结果如图4(a)所示,正如前文所述,2017年9月25日至2017年10月25日,所有三个指数的波动曲线均在10月3~4日形成峰谷。事实上,容易注意到10月3日前后正好是国庆节放假期间,因此,本次研究的近30天实际上是一个特殊节假日时段,也就是不难解释全部演化曲线都呈现极大谷值的原因。

为了进一步验证上述直觉和论断,本文还选取了2017年春节作为例子,结果如图4(b)所示,无独有偶,两者展示出了惊人的相似。在两个不同的节假日时段,网络学习、MOOC、远程教育三个关键词均具有相似的网络关注度趋势。因此,可以在特殊节假日时段组织大规模的在线活动,适当采用外力干预和引导公众了解网络学习并开展网络学习,推进网络学习概念、原理和系统平台的普及化。

图4 特殊时段的网络关注度趋势

2.2 人群特征演化分析

网络学习的关注人群年龄分布包括19岁以下1%、20~29岁 12%、30~39岁为 54%、40~49岁为 31%、50岁以上为2%,这一现象与远程教育的关注人群分布基本相似。相对而言,MOOC的关注用户群年龄结构更加合理,20~49岁均约占1/3,这与网络学习、远程教育显著不同。此外,关注最多的人群中,网络学习、远程教育均为30~39岁年龄段,MOOC则是20~29岁,这就表明,MOOC作为后来居上的新生事物,更容易受到年轻人的关注。因此,在终身学习、学习型社会建设的大背景下,如何探索针对年长者开发合适的产品、开展相应的宣传等显得更具迫切性。

另外,网络学习的关注人群性别情况为男性56%、女性44%,与远程教育近似(男性51%、女性49%),MOOC则是男性显著多于女性,关注的男女用户人数比约为7:3。据不完全统计,目前的人口性别结构为117:100,从这个意义上说,更多男性用户使用百度搜索MOOC,网络学习如何引导女性用户的关注,并提供针对女性用户的特色产品,值得网络学习领域进一步研究和探讨。

图5 网络关注度的人群

2 .3设备特征演化分析

将来源于PC端、移动端的数据区分开来,相关结果如图6所示,总体上PC端的演化趋势基本保持平稳并伴随小范围的波动,移动端在整个统计时间跨度的前期保持稳中有升,但后期相对波动较大。

图6 不同设备入口的网络关注度整体趋势

在全时段,近7天移动搜索指数406,整体同比下降29%、环比下降17%,近30天移动搜索指数378,同比下降17%、环比下降6%,2015年以来,随着移动网络技术的发展,移动端逐渐占据绝对性优势,均值高于PC端,而且这种优势有进一步扩大的趋势。另外,对比图2(a)的整体演化曲线,网络关注度受到移动端的影响更大,换句话说,整体演化曲线与移动端演化曲线在趋势上更加相似。这就要求网络学习的相关部署可以顺应网民的需求,加强移动学习的开发和应用力度。与用户关注度类似,图7也列出了全时段的媒体指数演化趋势,与其他关键词相比,网络学习的媒体关注度极小,几乎没有有影响力的媒体事件。事实上,媒体关注度一定程度上必然会影响到网民的用户关注度。从这个角度上说,有必要适度利用媒体吸引用户关注网络学习,并利用网络开展各种在线学习。

图7 网络关注度的媒体指数趋势

2 .4空间特征演化分析

以省份分布为基础的空间关注度情况如图8所示,浙江省独占鳌头,广东、北京紧随其后,不分伯仲,传统意义上的经济群,如京津冀、长三角、珠三角,是省份排名前十的主要组成部分,整个西北、东北地区都没有省份进入前十,在国家不断推进教育公平均衡化的大背景下,以网络学习为基础,打破时间空间的限制,非常有利于学习资源的共建共享,相关研究任重而道远。

为了便于进一步分析空间关注度,将用户群所在地的各种分布详细情况列在表1中,如表1所示,从城市分布上看,北京、上海占据前两位,与省份排名对应的杭州、广州紧随其后。值得注意的是,深圳也排名进入前十,说明广东省的网络学习关注度地域分布极不均衡,类似的情况也包括浙江、四川两省。此外,山东排名省份第4,但济南仅进入城市第9,这就表明,相对其他城市群,山东的网络关注度更均衡。在地区分布上,华南片区除广东省外,其他省份和城市的网络学习关注度也不高,当然,从另外一个角度理解,这些地区的网络学习开展的潜力和市场都很大。

图8 按省份的网络关注情况示意图(此图非地图)

总体上,表1的结果表明,不管从哪个维度上理解,从网络学习的百度搜索指数所反映的情况来看,网络学习的发展尚不均衡,被寄望于改善资源均衡、教育公平的网络学习手段,仍然严格依赖于经济地理位置,形式并不乐观,未来势必影响到等相关产业的发展,制约终身学习、学习型社会的建设。

表1 网络关注度的空间分布情况

3 结论与讨论

通过百度指数研究了网络学习的时空关注度,主要的特征如下:(1)网络学习的时间特征基本稳定,但在节假日期间关注度急剧下降;(2)网络学习的空间特征分布不均衡,与用户所在地区的经济地理条件严格相关;(3)关注网络学习的年轻人远少于中年人,女性少于男性;(4)越来越多的移动端设备关注网络学习。鉴于这些特征,在节假日开展若干网络学习的公开活动,利用媒体适度加大不发达、欠发达地区的网络学习宣传力度,合理利用移动媒介,有效引导年轻用户或女性用户,提供针对特定用户群的特色产品等,都需要网络学习领域进一步研究和探讨。

猜你喜欢
关注度百度趋势
趋势
第一财经(2021年6期)2021-06-10 13:19:08
Robust adaptive UKF based on SVR for inertial based integrated navigation
百度年度热搜榜
青年与社会(2018年2期)2018-01-25 15:37:06
初秋唇妆趋势
Coco薇(2017年9期)2017-09-07 21:23:49
雄安新区媒体关注度
全国两会媒体关注度
暴力老妈
SPINEXPO™2017春夏流行趋势
“王者”泛海发布会聚焦百万关注度
国际公关(2015年10期)2015-12-17 01:09:58
百度遭投行下调评级
IT时代周刊(2015年8期)2015-11-11 05:50:22