基于信息挖掘技术的大学生微博行为研究

2014-04-29 07:41王萌张红英田娜严大虎
中国信息技术教育 2014年23期
关键词:教育技术微博

王萌 张红英 田娜 严大虎

摘要:本文将信息挖掘技术应用于大学生微博分析,以江南大学在校生为研究对象,通过收集学生的微博数据,对微博内容和行为进行分析,力求以真实的微博数据为依据,客观地反映当前大学生微博的使用现状,并探究不同群体大学生的微博行为差异。

关键词:微博;信息挖掘;教育技术

● 引言

微博作为新兴的网络传播工具,受到越来越多用户的青睐,微表达、微传播的影响力与日俱增。在校园里,微博逐渐演变成学生的一种生活方式,从吃、穿、住、行到揭露时弊、参政问政,涵盖了生活的方方面面,微博空间已成为大学生不可缺失的“第二交往空间”。针对大学生这一群体的微博行为分析成为研究热点。

纵观学术界,针对微博的相关研究及其涉及的学科范围非常广泛,可以归纳为两个层面,一个是技术层面,从计算机科学技术、人工智能等自然科学的角度,主要研究微博短文本理解、微博内容挖掘、微博情感分析、微博用户社区挖掘。另一个是应用层面,从心理学、教育学、传播学、营销管理等人文学科的角度,主要研究微博的系统功能、微博信息传播模式、与学科教学的结合方式、微博交往的心理机制和行为特点、微博意见领袖。技术层面的研究多采用各种信息处理技术,如中文分词、命名实体识别、文本分类、情感分析,对微博文本建模,进行语言处理和文本分析。而应用层面的研究多采用调查问卷的方法、半结构化访谈方法来获取用户使用微博的相关数据,进而对获取的数据进行定量分析。而结合两种研究手段,将信息挖掘技术应用于用户微博行为分析的研究相对匮乏,因此我们做了此次研究。

● 实验流程

本次研究主要由三部分组成:微博账号的收集、微博数据的采集及整理、微博内容及行为的分析。

1.学生微博账号收集

以自愿为原则,线上和线下两种渠道并用,以调查问卷的方式,收集大学生的新浪微博昵称,收集信息为:新浪微博昵称、所在院系、性别、年级。本研究先将调查对象限定为江南大学在校生,学生的专业尽可能涵盖文、理、工、艺、体、医等多个学科,年级包括从大一到大四以及研究生一至三年级,多元化的调查对象带来大量而真实的数据,有利于进行定量分析和对比研究。

2.微博数据采集及整理

利用公开下载的微博数据采集软件weiboCrawlerApp_3.0.9对收集到的微博账号进行数据采集。输入微博账号名称,该软件从新浪微博上获取指定用户发表的所有微博内容,并以文本格式文件保存,下载内容如表1所示。

根据收集到的微博信息的特点,我们设计了两个核心数据表,对下载的微博数据进行归类整理,数据表的结构说明如表2所示。

● 微博数据分析

通过近一个月的数据采集,共收集到微博账号30个,其中有效账号20个,学生分布情况如表3所示。调查对象数据量未达到预期的目标,主要原因是学生对此调查心存顾虑,不愿意提供微博账号,还有部分同学提供“死”账号(从未发布任何微博的账号)。20个微博账号共发布微博12610条,本文的数据分析都来自于以上微博数据。

1.登录方式

学生发布的12610条微博,其中有3179次由手机客户端发布,9431次由电脑客户端发布,详细分布见下页图1。在宿舍学生一般会使用电脑登录,而在外面的时候多使用手机。微博可以通过手机网络以短信、彩信的方式更新,这正是微博的优势所在。

2.发博时间

本文对20位样本的12610次发布微博的时间进行了统计,以两个小时为一个时间段,发博时间分布如下页图2所示。数据显示,学生的微博发布量有一个高峰,集中在每天18:00~22:00。参考江南大学的作息时间表,这个时间段是属于下课时间,学生有空闲来发布微博,而在上课时间微博量下降,凌晨时间段没有微博发布。

3.微博情感分析

微博中的信息呈现碎片化的特性,微博不需要特别的逻辑和文法,任何一段话,几个词甚至一个表情符号,都能成为一条微博。微博作为大学生对话交流、思想分享的平台,越来越多的学生通过微博来表达自我、宣泄情绪、评论时事、分享消息,微博内容多带有强烈的情感倾向。微博情感分析主要是进行情感极性的判定,即判断一条微博消息表达情感是正(积极)、负(消极)、中性(中立)。本文使用的情感分析软件是武汉大学ROST虚拟学习团队编写的ROSTCM6,该软件具有文本操作、聊天分析、全网分析、网站分析等功能。我们利用其中的情感分析模块对20位学生的12610条微博进行了分析,微博情感分布如图3所示。数据显示,本次调查样本中情绪积极占绝大多数。

● 基于大学生微博使用情况的几点思考

如何引导学生合理使用微博,是摆在高校工作者面前的一个重要课题。根据本次大学生微博行为的调查结果,提出以下建议和思考。

1.管理微博使用时间,防止上瘾

微博作为一种便捷的网络交流工具,对学生的自觉性和自控能力要求很高,为了避免学生沉迷网络,甚至上课时间都在发微博,必须引导学生自觉管理微博使用时间。例如,在课程表定义的时间域内禁止登录,每天在线时间不得超过2小时等。

2.利用微博开展微型学习

微博“碎片化”的技术特点适合支持微型学习。微型学习中,学习者利用零碎的时间片段在课下或者一些并不适于集中注意力的环境中进行学习。利用微博的多种媒体形式(如文本、图片等)为学生提供简明的微型化学习内容,设置适当的学习目标。微博在支持教育信息资源共享、教学交互等方面有着广泛的应用前景。

3.掌握学生思想舆论动态

利用信息挖掘技术,对学生微博的进行话题分析和情感分析,可以实时掌握学生的思想舆论动态及情绪走向,这对于提高处置网络突发事件的能力和监管能力有着非常重要的现实意义。

参考文献:

[1]王亚煦,等.大学生使用微博的现状分析及对策研究[J].长春师范学院学报(人文社会科学版),2012(2):132-136.

[2]张琪.大学生微博交往动机与行为特点研究[J].电化教育研究,2012(8):54-58.

[3]闫幸.微博研究综述[J].情报杂志,2011(9):61-65.

[4]林书兵,徐晓东.微博客及其教育应用探析[J].电化教育研究,2010(3):16-20.

[5]张剑峰,等.微博文本处理研究综述[J].中文信息学报,2012(7):21-27.

[6]龚才春.短文本语言计算的关键技术研究[D].北京:中国科学院研究生院,博士学位论文,2008.

基金项目:本文受国家自然科学基金(项目编号:61300152)资助。

猜你喜欢
教育技术微博
中小学教育中的教育技术应用有效性研究
中等职业教育中教育技术的应用研究
“985工程”高校图书馆阅读推广的调查与分析
事实与流言的博弈
关于高中语文教学中微博的有效运用思考
现代教育技术在体育院校教学改革中的应用研究
从《ET&S》与《电化教育研究》对比分析中管窥教育技术发展
从教育技术的视角看数字化教育出版
医学生人文精神培养研究与实践
微博视阈下大学生思想政治教育研究