大学生“数据”能力的培养体系设计

2018-01-15 09:52陈志刚
智富时代 2018年11期
关键词:解决问题能力数据数据处理

陈志刚

【摘 要】探讨了大数据时代背景下“数据”能力对各专业大学生的意义。接着从数据处理相关理论知识,计算机能力和实际解决问题能力三个方面,分析了现有教育体系的不足,针对性地提出大学教育中应加强应用统计理论的学习,掌握主流的数据处理语言(如R)和加强在毕业设计中“数据”应用。

【关键词】大数据;数据处理;计算机能力;解决问题能力

一、大数据时代的定义

随着信息技术的迅猛发展,当今社会已进入大数据时代。大数据是指无法在可容忍的时间内用传统IT 技术和软硬件工具对其进行感知、获取、管理、处理和服务的数据集合。大数据具有体量浩大、模态繁多、生成快速和价值巨大但密度很低等特点 [1]。每天各行各业中都产生海量的数据,2011年全球被创建和复制的数据总量为1.8ZB(10的21次方),远远超过人类有史以来所有印刷材料的数据总量(200PB)[2]。对数据的处理和分析,挖掘和运用已经成为几乎每一个行业的基本职能之一。有效的使用这些数据将会极大促进国家和社会发展,加快经济增长,并为科学界提供了新的研究方法。

二、“数据”能力在大学教育中的地位

在我国大学教育中大数据的影响力正在体现。许多著名高校如北京,清华,人民大学,复旦大学和中南大学等都开设了数据科学相关专业。大数据的影响力体现在整个社会领域,几乎每一个大学专业都会与大数据打交道。应用学科领域中,在经济与管理领域,通过收集大量数据,运用统计和计量的方法进行实证研究。在计算机领域,通过数据了解用户的行为模型,挖掘有用的顾客信息。在生物领域,通过数据帮助生物学家正确地准备实验,进行实验,验证实验结论,并正确解释实验结果,更好理解复杂的生物医学现象和确定药品疗效。在工程领域,通过工程和制造中各种数据,进行实验设计,质量控制,过程控制,可靠性工程和系统动力学识别等。即使对纯理论的学科,大数据依然发挥着重要作用。如在物理研究中,通过大数据验证微观系统的概率特性,解释和定量描述许多复杂现象如超导性,超流动性,湍流和液体的结构特征。甚至在文学和历史领域也可以运用大数据来掌握作者写作风格分析,对历史事件进行分析等。无论是国家政府部门、企事业单位、科研团体还是个人等,数据分析都是进行决策的前提条件,因此数据分析相关技能也有广泛的就业面。全球的数据相关工作需求量一直很大。根据LinkedIn劳动力报告,在美国专业数据分析人员需求比五年前增长六倍,数据分析师将成为未来五年内最热门的职位。IBM研究报告也预测,到2020年美国数据科学家、数据开发人员和数据工程师的年需求将导致70万新职位。

三、“数据”能力的培养体系设计

数据分析和处理能力是所有现代大学生必备的一项技能。数据分析是一个复杂的过程,包括从获得数据,处理数据,分析数据,展示数据,解释和分析数据,及结论的解释,这些都需要通过具有专业技能人才来完成。在大数据时代背景下,有必要针对性加强现有教育体系中“数据”能力培养,进一步提高所有大学生的“数据”能力。具体来说,作者认为有三个主要方面,加强应用统计理论的学习,掌握主流的数据处理语言(如R)和在毕业设计中加强大数据应用。

(1)加强应用统计理论的学习

现在本科生开设有概率论与数理统计课程,但所给的学时均较少,设计内容较多。在数据分析领域中,存在大量的统计相关理论,较短的学时无法使得学生对统计有一个充分的了解。大多数课程只是侧重于概率理论的讲解。而到专业课领域,专业老师更偏重于实际运用。培养过程中只强调了概率理论和应用。学生缺乏从理论到模型,再从模型到实际运用的环节。他们经常熟练的运用计算机软件,搜集大量的数据,得到一堆分析结果。却并不理解分析结果的理论背景和意义。导致经常胡乱理解“数据”的分析结果,得到不准确的结论,有时甚至是错误的。学生不仅要了解数理统计模型中如何运用概率论的知识,也要掌握如何运用数理统计模型解决实际问题。可以大幅增加概率论与数理统计课程的学时,由多名老师组成课题组。每个老师分别侧重一部分内容,如概率论,数理统计模型,专业领域数据的处理和应用等。并且课程组要一起制定教学大纲,特别注意各部分内容的衔接。

(2)掌握主流的数据处理语言(如R)

数据处理过程中,所有步骤都需要通过计算机完成。现有的教学体系中,大多数通过c语言来传授编程的思想。在专业课中采用本专业特有的软件来进行数据分析。在信息时代,诞生了一门专门进行数据处理的语言R。R是一套由数据操作、计算和图形展示功能整合而成的套件。包括:有效的数据存储和处理功能,一套完整的数组计算操作符,完整体系的数据分析工具,强大图形功能等[3]。R语言具有很多优秀的性质:首先它是一个开源免费的软件,吸引力大量的使用用户,许多统计学家为其提供服务。目前它是发展最快,用户量增加最多的统计软件。拥有上万不同统计功能的程序包,并且仍然不断增加。新出现的统计算法首选通过R发布。其次它是一门编程语言,通过编程可以解决所有统计方面的问题,而不需要针对不同问题采用特殊的专业统计软件。这些特点决定了R语言非常适合大学教学使用,在计算机能力培养方面实现了从编程到统计运用的统一。

(3)在毕业设计中加强大数据应用

尽管通过大学四年的学习,学生具有了与“数据”打交道基本知识和能力。但是“数据”的处理是一个非常复杂的过程,存在大量的相关统计知识和相应的软件实现过程,以及实际问题中的各种不确定性。没有人可以完全掌握所有的统计知识,预知解决问题中的所有困难,当大学生通过前三年的学习掌握了基本的“数据”处理理论和技能时。进一步需要真实地解决一个现实问题。需要学生自己去设计调查方案或实验,收集数据。选取适合的统计模型,理解模型的作用、自学所涉及的概率和统计知识。尝试运用数据去发现或解决问题。通过实际运用过程加强学生对“数据”的理论和处理流程的理解,对于“数据”能力的提高是十分必要和至关重要的。在毕业设计中,要强调问题为真实和源自于实际。引导学生采取用“数据”说话的方法解决问题。

四、结束语

在大数据时代背景下,本文首先分析了“数据”能力对各专业大学生的意义。接着从数据处理相关理论知识,计算机能力和实际解决问题能力三个方面,探讨了现有教育体系的不足,并针对性的提出三方面的解决措施:应加强应用统计理论的学习,掌握主流的数据处理语言(如R)和加强在毕业设计中大数据应用。

【参考文献】

[1]李国杰, 程学旗. 大数据研究:未来科技及经济社会发展的重大战略領域—大数据的研究现状与科学思考[J]. 中国科学院院刊, 2012, 27(6):647-657.

[2] Gantz J, Reinsel D, Gantz B J. Extracting Value from Chaos[M]. International Data Corporation and EMC, 2011.

[3]李强. R语言融入数学专业课程教学的探索与实践[J]. 高教学刊, 2015(9):24-24.

猜你喜欢
解决问题能力数据数据处理
认知诊断缺失数据处理方法的比较:零替换、多重插补与极大似然估计法*
ILWT-EEMD数据处理的ELM滚动轴承故障诊断
转换数量关系角色,提高解决问题能力
浅谈计量自动化系统实现预购电管理应用
基于希尔伯特- 黄变换的去噪法在外测数据处理中的应用
基于POS AV610与PPP的车辆导航数据处理