王焕阳 杨睿 陈铮 林子玄 金玥
摘要:对于了解研究大学生的学习状态、消费观念、价值取向等系列问题,离不开调查研究、而传统问卷形式只具有短期吸引力,形式也较为分散,回收率低,根据美国GSS调查(1972-2002年)传统问卷调查的平均回收率仅为76%,且问题的回答质量不高。而与传统问卷调查相比,采用分组问卷调查得到的数据更易划分,更集中,问卷的回收率和有效率明显提高,通过实验表明分组问卷调查的回收率达到86.67%。但与此同时,发现存在數据“选项过度集中”和“固定选项模式”的问卷,对结论分析造成一定的影响。为进一步提升问卷的有效率,决定采用以方差为基础的数据筛选方法,从影响问卷有效率的两种因素入手,对问题问卷进行全面而深入分析,并在此基础上研究了问卷筛选算法以及问卷筛选系统,大大提高了问卷的有效率,客观的反映出了问卷的真实情况。
关键词:问卷调查;学生调查;筛选算法;筛选系统
引言
通过对大学生进行问卷调查,以便得知当代大学生的价值观,消费观,学习状态等一些列问题,通过所得数据反馈于大学生,用于帮助教师教学,企业提供个性化服务。本研究主要从如下几方面进行:
1)问卷调查方式。区别于传统的问卷调查以及网络问卷调查,本研究主要采用面向大学生的分组调查方式,根据已研究的数据表明,问卷的回收率达到86.67%,有效问卷数据占总数的86.15%,大大提高了问卷的回收率与有效率。
2)人工数据集的建立。由于调查力度有限而导致数据过少,采用随机生成数的方式,建立一个符合实际情况的人工数据集以便进行数据分析。
3)问题数据处理。通过对分组得到的数据的进行分析,发现存在数据“选项过度集中”和“固定选项模式”的问卷。设计一种算法融合分组调查的两种情况(“选项过度集中”与“固定选项模式”问卷),得出最终的分析结论。
4)问卷筛选系统。将算法与程序相结合,编写可执行程序,实现问卷筛选功能。
1.对大学生的研究调查
1.1 国内研究
中国有关大学生发展调查的实证研究发展至今已初具规模。2007年清华大学引进全美大学生学习参与度调查 NSSE ,并邀请27所院校联合组建NSSE-China项目团队,项目发展至今已经扩展为“中国大学生学习与发展追踪调查” 2007 。北京大学教育学院课题组自2006年开始每年都进行“首都高校学生学业发展状况调查”,调查参考了美国的NSSE调查、UCLA的CSS调查及日本东京大学的CRUMP调查等。北京师范大学的周作宇于2001年引进美国的College Student Experiences Questionnaire CSEQ ,开展“中国大学生就读经验调查”。由杜智敏主持的课题组自2002年起,在北京市高校开展了针对大学生学习状况的调查,即“北京市大学生学习状况调查”。
1.2 国外研究
世界不同国家和地区的院校均开展了许多调查以收集大学生在校学习及发展的信息。以美国为例, 到目前为止已存在多个针对大学生群体、以了解本校教育现状为目的、以提高教育质量为目标的大学生发展调查, 如NSSE、大学生学习评估 (CLA) 、CSEQ、CIRP等。这些调查有的关注大学生发展的输入特征, 有的关注产出特征, 也有的关注大学生的学习经验。在研究大学生发展状况方面影响最广的全国性研究主要是NSSE和CLA。澳大利亚主要实施的是大学生课程体验调查 (CEQ) , 它将学生在课堂上的学习体验作为增值评价的手段, 通过调查大学生课程学习体验了解大学生整体的学习发展状况。
2.问卷调查方式比较
2.1 传统调查方式
传统调查模式有举手表决,投票表决等方式,发展到现在以问卷调查为主。但传统纸质问卷调查投入人力物力较大,调查成本较高,周期较长,而且问卷回收率低以及效率不高。
随着科技进步,网络调查问卷登上历史舞台。国外的调查网站surveymonkey提供了这种方式,国内的问卷网、问卷星、调查派等网站提供了这种调查模式。网络调查问卷虽然无地域限制,成本相对低廉,但却无法保证调查对象的参与比例,以及问卷的回答质量。
2.2 分组问卷调查
对于大学生来说,我们进行走进课堂或班级或者寝室,通过对学生进行分组,采用组内成员共做一张问卷的方式进行数据采集,这样统计出的数据更易划分,更集中,能通过同学间的互相带动收集到更有效的数据。根据已研究的数据表明,分组问卷的回收率达到86.67%,超过了传统问卷调查的回收率(美国GSS调查,1972-2002年,平均回收率76%),有效问卷数据占总数的86.15%,大大提高了问卷的回收率与有效率。
3.人工数据集的建立
通过对问卷调查所获数据的整理分析,我们发现数据符合正态分布模式(如图1所示),受问卷调查对象限制,所得数据规模无法达到足够大,我们利用数据仿真技术建立符合调查数据规律的人工数据集,作为进一步研究的对象。在MATLAB仿真软件中用normrnd()函数生成服从正态分布的随机数(如图2所示)。在随机生成的数据集中,发现存在一定数量的符合“固定选项模式”的数据行(如图3所示)与“选项过度集中”的数据行(如图4所示),证明我们所提出的算法产生的人工数据集可以有效仿真真实的问卷。
4.算法建立
建立针对新问卷调查模式的数据处理算法,筛选出新模式下出现的问题问卷。根据前述,分组问卷调查可以起到提高问卷回收率和有效率的积极作用,同时也可能会带来“选项过度集中”和“固定选项模式”等干扰因素,对应学生在问卷作答时的“盲从”和“敷衍”的负面情绪。对此,本研究通过对符合问卷调查实际的随机数表的模拟问卷数据进行分析,发现通过方差的方式可以进行数据融合完成针对包含多种类型问题数据的调查问卷的筛选工作,以此为基础设计了一种解决了分组调查的两种干扰情况(“选项过度集中”与“固定选项模式”问卷)的算法。
5.筛选系统建立
将算法与程序相结合,根据研究所得筛选算法,使用高级语言来编写一个可执行程序,实现问卷筛选功能,根据系统基本功能分析,我们得到了系统功能模块图(如图5所示)。设计采用方便易操作的想法,运行系统后,首先使用数据导入功能将处于某一位置的Excel表中数据导入后台数据库(如图6所示)。导入数据后,利用筛选算法对目标数据进行筛选,在主界面显示含有两类问题(“选项过度集中”与“固定选项模式”)的数据行与问题问卷概况(如图7所示)。了解数据概况后,可进一步查看数据详情与问题问卷详情(如图4所示)。点击每行按钮可查看错误详情:点击左侧各个“问卷详情按钮”,可查看各份错误问卷的具体数据(如图8所示);若点击右侧各个“类型详情按钮”,可查看各个错误类型的详情。综上所述,将目标数据导入系统中,需导入功能;筛选功能则是系统的重中之重,將目标数据筛选完成后得到所需数据是系统的主要功能;查看各种数据详情则需要详情查看功能和问题数据详情查看功能。
6.结语
随着云计算、移动互联网和物联网等新一代信息技术的创新和应用普及,21世纪人类飞速的进入大数据时代,现在越来越多的企业需要抓住大学生市场,将海量碎片化的信息数据及时地进行筛选、分析,并最终归纳、整理,得出企业最终需要的信息,以便进行面向大学生的个性化服务。本研究的群体主要为在校大学生,大学生群体作为社会的重要组成部分,越发受到社会关注,近年来,大学生所占消费比例越来越大,已然成为不容忽视的特殊消费群体。例如在餐饮行业,可应用问卷调查分析进行餐饮经营模式的优化,以便提供针对大学生的特色餐饮。在通信方面,可提供针对大学生的通信套餐,同时也可以从社会活动方面对大学生产生针对性政策。无论是从工作、学习、生活等各个方面,都能根据分析所得结论提供更具体的针对性服务,从而产生更好的影响。而随着经济的发展和科技的进步,大学生的消费支出将会逐年增加,且增幅越来越大,由此看来本研究对于学校教学以及企业个性化服务都有非常大的借鉴作用。
参考文献:
[1]曾五一, 黄炳艺. 调查问卷的可信度和有效度分析[J]. 统计与信息论坛, 2005, 20(6):11-15.
[2]邓娟, 吴菁, 崔静,等. 基于“雨课堂”的翻转课堂实施的实践与思考[J]. 护士进修杂志, 2018, 33(2):152-154.
[3]问卷调查中量表缺失值填补方法的模拟比较研究[D]. 中国医科大学, 2018.
[4]刘超. 软件工程数据挖掘研究进展[J]. 农家参谋, 2018(3):201-201.
[5]何鑫. 大数据时代背景下电子商务的发展趋势[J]. 现代商贸工业, 2018, v.39(21):45-46.
[6]明粉娟. 数据透视表在审计工作中的应用[J]. 财会学习, 2018(9):151-151.
[7]Kohavi R, John G, Long R, et al. MLC++: a machine learning library in C++[M]. 1994.
[8]Bradski G, Kaehler A. Learning OpenCV: Computer Vision in C++ with the OpenCV Library[M]. 2013.
基金项目:沈阳师范大学大学生科学研究基金项目“基于考核数据的大学生画像研究”(L(A)2019309)
沈阳师范大学 软件学院 辽宁 沈阳 110034