张人中 马莎潇
摘 要:在大数据时代,教务管理系统和学生综合信息平台上关于学生的数据越来越精确,这些数据可以用来刻画出学生的一个用户肖像。本文利用数据挖掘和数据分析技术刻画学生用户肖像,希望利用大数据时代的新技术来实现高校的数据化管理,从而达到对每一位同学因材施教的目的。同时,学生用户肖像的刻画也可以反映学生从入校之后的成长历程,为学生的职业规划提供一定的参考。
关键词:肖像类型;数据;信息
中图分类号:TP393 文献标识码:A
一、什么是用户肖像
用户肖像技术是指将用户标签化的标签内容进行拆解,再利用数据挖掘技术针对用户肖像标签内容进行处理得出标签的数据模型,并将数据进行语义翻译解释后描述用户特征的一种分析技术。
二、用户肖像有什么用
在海量的信息面前,用户通常无法快速且精确地筛选出真正感兴趣且有价值的信息并做出正确的选择。如何提高信息的使用效率以及用户获取信息的精确度成为亟待解决的问题。
以往的个性化推荐系统是从长期积累的海量数据及用户行为信息中挖掘出用户的个化特征、行为特征、偏好特征等,将这些特征标签集合在一起勾勒出用户的用户肖像,然后根据描述出的用户肖像,向用户推荐他可能会喜欢的或者对他有用的信息和资源。用户肖像还可将用户数据可视化,综合展现用户的各方面能力。
三、本文所构建的用户肖像
本文利用校园的综合信息平台进行数据挖掘,通过指标体系来构建学生用户肖像,通过数据可视化全面的精确的展现学生的综合能力。
四、学生用户肖像模型建立
1.构建学生肖像
构建用户肖像简单来说就是人为制定标签规则,并通过标签快速读取其中的信息,方便机器做标签提取和聚合分析。所以用户标签向我们展示了一种用于描述用户信息的简洁朴素的方法,构建用户肖像的流程是:数据源分析→目标分析→数据建模。
2.数据源分析
构建用户肖像的最终目的是还原用户信息,所有数据即所有用户相关数据。本文主要从5个方面构建学生用户肖像:成绩、体能、实践技能、价值观、性格。用户相关数据分类没有固定的方法,可以根据应用场景、业务需求的不同而有所不同。本文利用的分类方法是封闭式分类方法,该方法有助于后续不断枚举并迭代补充遗漏的信息维度。例如:性格分为知觉、外倾、思维、感觉、判断、内倾、情感、直觉八大类,成绩则通过绩点和各科专业成绩来进行评估.....所有的这些子分类构成了类目空间的全部集合。
本文通过收集教务管理系统的成绩信息和学生管理的系统的相关数据信息来构建用户肖像模型。
3.目标分析
构建用户肖像的最终目标是通过分析用户的数据和行为来给用户打上标签,同时给每个标签赋予一个合理的权重(如:成绩0.8,实践能力0.6)。
标签:表示了内容,用户对于该内容有需求、有兴趣、有偏好等。
权重:表示了程度,即用户对于该内容的需求、兴趣、偏好指数,也可以简单地理解为可信度、概率。
4.数学建模
数据建模是指通过构建模型来产出标签和权重。一种常见建模模型包括:时间、地点、人物三要素,用户的每一次行为本质上是一个随机事件,可以描述为:什么用户、在什么时间、什么地点,做了什么事。
五、学生用户肖像模型建立
1.学生标签信息的测量方法选择
本文基于对学生教务管理系统以及学生综合信息平台的数据挖掘,参考以往的用户肖像评价模型,选出成绩、体能、实践技能、价值观、性格五大标签,其中性格又可以细分为知觉、外倾、思维、感觉、判断、内倾、情感、直觉八大标签。即建立综合学生用户肖像模型和基于性格方面的详细数据分析。
六、用户肖像模型的应用
1.用户肖像分析
本文以湖南师范大学应用心理学专业某同学及其班级数据举例分析。
图1及图2很直观地表现了该用户的个人综合能力及其性格倾向。图1数据来源于学校综合素质评价系统、性格分析及价值观问卷,由分析图可知:该用户成绩优秀,优于班级88%的人;性格外向,但其体能、实践技能、价值观都处于中等水平,仍需要继续努力,才能提高自身的综合素质。图2数据来源于MBTI性格测试量表,该用户属于外倾感觉思维知觉类型,具有灵活、忍耐力强、实际、注重结果的特点,并且喜欢积极采取行动解决问题,注重当前;综上,该用户适合土木工程师、旅游管理等工作。
2.详细数据分析
在分析图中各维度细化即可查看详细数据,以下是对详细数据的说明:
(1)成绩
成绩一栏可查看成绩加权平均分、个人成绩柱状图、成绩各分数段人数统计图以及在班级的位次。由图表可以直观地看出该用户的学科优势及学科弱势,从而及时地进行查漏补缺,保证各科的均衡发展。其次,还可以通过图表看出该班级总体成绩的具体情况。
(2)体能
体能一栏可查看体能平均分、各项体能成绩柱状图、体能各分数段人数统计图及其在班级的位次。与成绩一栏相同,体能这一栏里所呈现的图表都能直观地反映出该用户各项体能的成绩,以便用户即使觉察到体能较弱的项目,从而积极锻炼身体。其次,还可以通过图表了解该班级总体体能情况。
(3)实践技能
实践技能一栏可查看实践技能平均分、个人实践技能成绩柱状图、实践技能各分数段人数统计图以及在班级的位次。实践技能由文艺竞赛类、课外考证类、专业竞赛类、活动组织类、公益实践类组成。由图表可以看出其实践能力的发展水平,对学校以及对个人都有一定的参考作用,以便制定提高实践能力的培养计划。
(4)价值观
价值观一栏可查看价值观问卷分数、个人价值观分数柱状图(图3)、班级价值观分数柱状图(图4)以及在班级的位次。由图9数据可知该用户做事心态的分数仅33分,意味着该用户做事毛躁,难以沉下心,需要培养自己的细心和耐心;同时,其利他行为是满分,意味着该用户善于为他人考虑,站在他人的角度思考问题。该用户的价值观问卷分数优于班级46%的人。从图3的分析来看,该班级成员总体价值观问卷测试的分数较高,这与其整体班风或有一定的联系。
(5)性格
性格一栏可查看个人性格类型、个人性格倾向图(图5)以及班级成员性格分布饼状图(图6)。由数据可知该用户属于外倾感觉思维知觉类型,最突出的性格倾向为外向,具有灵活、忍耐力强;对于理论和抽象的解释感到无趣。适合企业家、股票经纪人、保险经纪人等职业。由图6可得知该班级INFP、INFJ、ENFP类型的人数共占班级人数的38%。根据MBTI量表的职业推荐,这三类型的人适合的职业均包括心理学方面。因此,从这个层次上来看,该班级的专业对其班级成员的性格倾向有着一定的影响。
结语
通过上述数据分析方法,从成绩、体能、实践技能、价值观、性格五大方面对学生和班级进行肖像刻画:从学生角度上可直观地看出学生的强项和弱项,还可以通过性格分析得出学生是属于什么性格的人,这对学生的职业规划也有参考价值;对班级而言,本文以湖南师范大学心理学某班级为例进行了数据分析,从成绩、体能、实践技能、价值观、性格5个方面展现了班级的总体风貌,可以得出该班级体能都较优秀、班级整体班风(价值观)较好,班级INFP、INFJ、ENFP类型的人数最多,而这三类型的人适合的职业均包括心理学,可见专业对学生性格有着一定的影响。本文通过学生用户肖像的建立可以直观地展现学生个人和班级体的综合情况。对学校的教学培养、同学的职业规划也起到参考作用。对于互联网+校园信息平台的应用也有着巨大的发展前景和商业价值。
参考文献
[1]陈劳,张建华,周林志. 数据“慧”说话:用校园网数据绘制用户画像[J].中国教育网络,2016(5):75-78.
[2]余孟杰.产品研发中用户画像的数据模建——从具象到抽象[J].设计艺术研究,2014(6):60-64.
[3]张慷.手机用户画像在大数据平台的实现方案[J].信息通信,2014(2):266-267.
[4]董莉莉.剖析大数据时代下用户画像及媒介策略[J].传媒,2016(2):82-83.
指导老师:刘宏、孙雯波。