张琳,王楠楠
(大连海事大学,辽宁大连 116026)
随着信息技术的飞速发展,当今社会已经进入了大数据时代。为了全面推进我国大数据的发展和应用,2015年,国务院印发《促进大数据发展行动纲要》,对我国大数据发展进行了顶层设计和统筹规划,彰显和强化了大数据在国家战略中的突出地位[1]。党的十八届五中全会提出了要实施“国家大数据战略”,标志着大数据战略正式上升为国家战略。2016年,“十三五”规划纲要把大数据作为基础性战略资源,对全面促进大数据发展提出方向性目标和任务。2020年,中共中央、国务院发布的《关于构建更加完善的要素市场化配置体制机制的意见》中首次将数据作为一种生产要素,强调要加速培育数据要素市场,推进数据开放共享,提升社会数据资源价值。
在国家政策的推动下,大数据技术得到了快速发展,并对各行各业都产生了巨大影响,也使各行各业都积累了海量数据。随着数据量的增长,人们越来越深刻地认识到数据的价值,但如此庞大、分散、类型繁多且价值密度低的数据资源经常让企业束手无策,不知该如何挖掘其价值,导致很多企业面临“海量数据,知识匮乏”的局面。因此,如何快速、准确、实时地从这些数据中获取所需要的信息,成了各个行业面临的重要问题。
数据分析是指为了产生有用信息,利用处理数据和分析数据的相关理论和方法,对收集来的大量数据进行详细研究和概括总结的过程[2]。数据分析可以为企业的管理决策提供可靠依据,增强管理的科学性。在大数据环境下,数据分析已成为各行各业发展的迫切需求。以电商行业为例,根据艾瑞咨询对国内超过1 000家企业的调查,97.9%的企业认为数据分析对电商运营很重要,同时有75.7%的企业认为自身分析数据和挖掘数据价值的能力欠缺,而且超过一半的企业希望专业数据分析人才的加入,并愿意为其支付更高的薪资[2]。
信息管理类专业主要指《普通高等学校本科专业目录(2020年版)》专业分类代码中1201和1208下属的相关专业,主要包括信息管理与信息系统、大数据管理与应用、电子商务等专业[3-4]。信息管理类专业具有跨学科的特点,致力于培养集计算机技术、管理理论、信息资源管理于一体的复合型应用人才。
为了适应市场对数据分析人才的需求,信息管理类专业对学生数据分析能力的要求逐渐提高。多数高校的信息管理类专业已经将数据分析能力作为学生的核心能力之一,将培养具有数据分析能力与管理决策能力的复合型、创新型人才作为专业的培养目标之一。
信息管理类专业既有的课程体系中包含了一些与数据分析相关的课程,如《信息处理概论与计算机原理》《C语言程序设计》《Java程序设计》《管理统计学》《数据结构》《商务智能方法与应用》《数据库原理》《XML与Web数据管理》等,因此,信息管理类专业的学生具备一定的统计学思维和编程能力,掌握一些典型的数据结构和算法,了解常用的数据分析和挖掘模型,能够熟练使用C语言和Java语言编写程序,实现对少量数据的分析挖掘,也能够使用SPSS等软件工具对数据进行统计分析[5]。虽然信息管理类专业学生具备一定的数据分析能力,但在大数据背景下,学生在数据管理和信息分析方面还存在以下问题:
(1) 数据意识亟待提高。用数据说话,以数据支撑决策可以帮助企业加强科学化管理,提高经营管理水平。但学生对数据能帮助我们解决什么问题、数据之间的关联、数据对管理决策的作用不是很了解[6]。学生的数据意识还比较薄弱,需要进一步提高学生的数据分析能力,让学生不断加深对数据用途和作用的了解,提高对数据的认知能力。
(2)虽然掌握一定的数据分析和挖掘模型,能够运用模型进行数据分析,但由于教学过程中采用的数据多是模拟数据,没有与实践相结合,且不需要学生自己采集,因此学生缺乏对能客观反映实际背景的真实数据的获取、处理、分析和运用的经验,发现知识的能力不足,对于得到的分析结果也不能很好地理解其意义。需要进一步提高学生的实践能力,将实践与理论相结合,提高学生的数据分析水平,让学生积极参与数据采集、数据整理到数据分析和运用的过程中,提高对理论知识的理解能力,增强运用能力。
(3)学生在课堂上接触的数据大多是少量的结构化数据,所以学生对规模庞大的结构化数据(如关系型数据库中的数据)、半结构化数据(如XML数据)和非结构化数据(如文本数据)的分布式处理、存储和分析能力不足,对大数据相关技术平台、NoSQL数据库,以及Python等数据分析工具的了解较少。
(4)数据的质量会影响对数据分析和挖掘的效果和效率,也会影响决策的正确性,而部分学生对提高数据质量的处理方法,如数据清洗、集成、转换、约减等,不能熟练使用。
(5)能够使用Excel,通过生成饼图、柱状图等统计图表,对数据和数据分析结果进行可视化,但数据可视化能力还有待进一步提高。
目前信息管理类专业既有课程体系中的《数据库原理》课程主要介绍的是对结构化数据的存储操作,涉及的数据库主要是关系型数据库,如MySQL,SQL Server等。而大数据不仅包含结构化数据,也包含规模巨大的半结构化数据和非结构化数据,因此增加《NoSQL数据库原理及应用》课程可以帮助学生掌握对半结构化和非结构化数据的处理和存储方式,了解常用的NoSQL数据库,如HBase、Mango DB、Neo4j的使用方法,为提高学生数据分析能力做准备。
增加《人工智能》课程或调整《商务智能方法与应用》课程为《人工智能与商务智能》,增加对人工智能相关知识的讲解,同时增加该课程的教学学时,增加《机器学习》课程。这两门课程的设置可以帮助学生掌握常用的数据分析处理技术、数据挖掘模型以及机器学习算法,了解模型算法的本质,提高学生利用模型发现知识的能力。
增设《大数据分析的Python基础》《大数据管理与技术》《大数据应用案例分析》《大数据可视化》等与大数据分析相关的课程[7],帮助学生了解当前流行的大数据技术平台,如Hadoop、Map-Reduce、Spark等、Python数据分析工具,以及大数据可视化工具,如Tableau、ECharts等,并通过大数据案例分析帮助学生了解大数据技术与传统BI和数据挖掘技术的区别,使学生认识和理解大数据的价值,提高其在大数据分析与处理方面的能力。
另外,也可购买大数据基础分析平台,以辅助大数据相关课程的实践教学环节,提供对海量数据的预处理、特征工程、多维分析以及机器学习模型的训练预测评估,帮助学生了解如何对全量大规模数据进行建模,提高学生的大数据建模和分析能力。
除了增加《大数据应用案例分析》课程外,在《XML与Web数据管理》《数据库原理》《人工智能与商务智能》《机器学习》等与数据分析相关的课程实践环节,教师可以通过设计和选取大量典型案例构建案例库,通过案例教学引导学生用数据思维分析实际问题,运用掌握的数据挖掘、人工智能,以及机器学习模型算法等理论知识对数据进行建模,并使用掌握的程序设计语言,如C、Java或Python等,来处理数据和实现模型,发现隐藏在数据背后的规律。将案例教学引入课堂,既可以激发学生参与数据分析的兴趣,培养学生的数据意识和数据思维,也可以提高学生的编程能力,帮助其深刻理解数据挖掘模型、人工智能算法和机器学习算法的原理和本质,体会数据分析的作用和意义。
为了帮助学生体会数据的作用以及数据背后隐藏的知识,除了课堂教学外,信息管理类专业可以与企业签订合作协议,让学生在课程实践环节或实习环节参与一些企业实际项目,亲身体验数据的采集、清洗、加工、存储、分析以及结果呈现过程。在这个过程中,教师或项目负责人需要指导学生读懂数据,理解数据的实际意义,了解数据之间的关联。校企合作方式具有很强的实践性,有助于培养学生的数据思维和数据意识,提高学生在数据获取、处理、存储、分析和可视化等方面的能力。
《信息管理课程设计》是本校信息管理类专业在大三第三学期开设的一门2学分的实践课,旨在指导学生对大学期间所学的专业知识进行综合运用。教师可以充分利用该实践课程和毕业设计环节,根据学生的研究兴趣,对想从事数据分析工作的学生,结合市场对数据分析人才的能力要求,为其分配一个与数据分析相关的研究课题,指导学生用所学的理论和技术分析问题和解决实际问题,提升学生理论联系实际的能力和数据分析能力。
鼓励学生参加中国国际“互联网+”大学生创新创业大赛、全国大学生电子商务“创新、创意及创业”挑战赛、大学生创新创业训练计划项目等竞赛或项目,体验从数据采集到数据可视化的全过程。通过参加竞赛或项目,既可以让学生理解数据分析的流程,掌握数据分析方法,也可以提高学生处理数据和分析数据的能力。
信息管理类专业的学生掌握一定的模型算法,具有一定的数据处理能力和计算机应用能力,因此在大数据环境下,信息管理类专业在培养学生数据分析能力方面具有优势。为了培养满足市场需求的数据分析人才,本文探讨了大数据环境下信息管理类专业提升学生数据分析能力的策略,通过完善课程体系、引入案例教学、校企合作、利用课程设计和毕业设计环节、鼓励学生参加与数据分析相关的竞赛或项目等方式,来培养学生的数据思维和数据意识,帮助学生掌握数据分析方面的技能,理解数据的价值和作用,全面提升学生的数据分析能力。