左飞 方宏彬
【摘要】本文通过阐述大数据时代统计人才的不足,对大数据时代下统计学教育方面提出几点改变,旨在相关人员能够主动进行与时俱进的充实、调整及变革。
【关键词】大数据时代 统计学 不足 改变
引言——置身于大数据时代
众所周知,因为互联网技术的井喷式发展,我们进入了一个IT时代,而随着QQ、微博、微信、朋友圈等社交网络的渐渐成熟,以及移动带宽的提速,云计算、移动APP的丰富(如淘宝,美团,滴滴等),产生海量的多源异构的庞大数据流,数据量呈现爆炸式的增长,我们很快迎来了大数据时代。每个人的生活中都充满了结构化和非结构化的数据,数据量的爆发式增长和硬件存储技术的发展让大量数据成为了潜力无穷的财富,大数据分析随之日益成为人们社会经济生活进行预测和决策的重要手段,大数据分析能力也已成为现代社会高端人才应当具备的基本技能之一,各行各业的人都开始说自己在搞大数据。
一、大数据时代统计学的不足
如今,计算机科学,信息技术,应用数学,计算数学,运筹学,电子工程,连政治领域都声称自己在做大数据。可又似乎唯独听不到统计的声音。大数据以数据为主体,而统计是关于数据的科学,所以统计对大数据的生命力和应用价值有着至关重要的作用。然而近代统计学虽已经发展了上百年,但是大数据时代的到来依然暴露出了统计学已有方法的缺陷。第一,数据类型,以前数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。而现在我们见到的图、文、声、像等信息都可以成为分析的数据。第二,过去我们是出现了问题才收集数据,然后建立合适的统计模型来揭示观测到的数据。大数据时代则不同,当前的人类技术能力可以处理海量的数据,要做的就是从泥沙俱下的大数据中提炼出有价值的知识和信息,这些有价值的知识和信息显然是非预期的,而统计学中大多选取样本、用一些统计方法随机抽取样本来预测整体,可能会丢失某些有用的信息。所以现阶段,无论对于个人还是企业亦或是国家,谁占领大数据时代的制高点,谁就赢得主动和先机。大数据方面的研究在美国、日本等发达国家已经上升为国家战略,中国目前的很多追踪调查项目都存在耗时过长的问题,中国的城镇化、智慧城市建设、政府简政放权、推进监管等都面临诸多统计上的挑战和需求,多元数据来源的整合,海量数据存储、数据挖掘、图像视频智能分析等都是对统计的新要求,这对统计学和统计学家是严峻的挑战。统计学家应该欣然欢迎大数据时代的到来,把它看作是统计学本身的一个大变革,通过对复杂数据开展深入系统的创新性研究,产生新的统计思想、新的统计工具,形成新的统计理论,从而推动其他重要领域和科学前沿取得突破。
二、大数据背景下统计学人才的培养
2014年11月,美国统计学会发布了统计学本科专业指导性教学纲要,这是在大数据背景下对2000年首次发布的指导性教学纲要进行的一次全面修订和更新,主要强调了四个方面的内容:
①数据科学日益重要,统计专业人才不仅需要扎实的数学和统计基础,还要有强大的统计计算和编程能力,可以熟练使用专业统计软件和数据库;②真实数据是统计专业教育的重要组成部分;③更加多样化的统计模型和方法;④通过语言、图表和动画等用户易于理解的方式表达数据分析结论的能力。可见作为当今世界第一强国的美国,都在跟隨世界潮流,努力的与时俱进,进行创新学习,我们更得快马加鞭,对以往的教育制度进行去粗留精,我个人觉得得从3个方面进行根本的改变:
第一,教育对象,对于老师,当前普通高校统计学教师的来源主要有两种,第一种多数是属于偏向经济学的经济统计专业出身,强调社会实践性的经济学思维,他们的统计学的理论基础不够扎实,对于一些较复杂的统计分析方法不太熟悉。另一种则是属于概率论数理统计专业出身,更多的注重理科思维的逻辑性和数量关系的推理推导。数理统计学专业教师的概率统计的理论基础扎实,但大多数又比较缺乏经济、金融等方面的知识。为适应大数据时代的发展需要和培养高素质的统计学专业人才,应用型地方高校统计学专业教师必须与时俱进,不断更新、补充知识,完善知识结构。在目前阶段,普通高校应用统计学专业可建立统计学专业教师团队,优势互补,形成1+1>2,能有效缓解当前师资力量中知识结构的缺陷。对于学生,如今社会对数据分析师的计算机技能、编程技能、大数据挖掘和统计建模技能、业务技能都提出了很高的要求。一个大数据分析人才需要是交叉学科型人才,除了要掌握统计学科的统计建模、数据挖掘等技能外,还需具备计算机学科及应用领域的相关知识背景。目前我国应用统计的交叉学科发展比较弱,各学科大多追求独立性的最大化,这种状况不利于大数据统计应用的科学发展,所以这需要政企产学研等多部门协同培养。
第二,教育内容,当前学校开设的统计学专业教育内容主要为统计学原理、多元统计分析、概率论与数理统计、时间序列分析,运筹学、抽样调查、数据挖掘以及相关的统计应用课程,还是以结构化数据为主要处理对象,而对非结构化和半结构化数据的分析和工具的使用则涉及不是很广。但是今时不同往日,大数据时代的到来,现今统计学课程及内容已不能满足从事非结构型和半结构型的大数据研究和商业应用对人才培养的需要,统计专业教育必须审时度势,以社会上对统计人才的实际需求为中心,不断丰富原有的课程内容,增开、补开新的课程,才能保证教育内容跟上大数据时代前进的脚步。把偏理论性的专业课程的课时适当减少,避免交叉重复,增加应用性较强的专业课程的课时,增加计算机方面课程的课时。另外,加强计算机方面的课程设置除了设置传统的数据库基础、C++外,还应设置跟商业应用强相关的数据库开发与设计、Python编程语言、数据可视化技术、数据仓库、数据结构与算法设计等与大数据相关的专业选修课程。
第三,教育模式,当前统计学教育模式主要以灌输学生知识,培养政府、企事业单位需要的统计工作人才为重要内容和主要目标,以课堂教育为核心,以教师讲授为主导,重理论体系,轻实际应用,重方法内容介绍,轻实际分析能力培养,重理论阐述、公式推导和模型构建,轻专业技能、适应能力和商业意识的培养,且教育手段单一,教育方式传统,教育团队的协作意识较差。培养出的学生大多数只擅长于进行公式推导、公式运算和数学模型分析,知识结构以数理知识为主,在经济学、管理学、计算机科学方面的知识相对不足,导致研究和观察视野狭窄,解决实际问题的能力不够。大数据时代虽然仍要求统计工作人员具有数据处理和分析所需的基本素质与技能,但更看重于其从海量数据中把握市场机遇,挖掘商业价值,为其所在的企业创造利润的潜在能力、探索欲望和创新精神,故现今统计学专业的人才培养模式是与大数据时代所需要之复合型数据分析人才不相适应的。必须得加强实践教学环节,学生基础薄弱,更应该强调学生的实际案例分析能力。另外,长城非一人之力完成,需要增加统计学生团队合作意识和资源共享。实践教学环节以提高学生的实践能力为目的,鼓励学生大胆提出问题,质疑结论,合理安排组织企业实习、企业案例分析、分组讨论、社会调查、数据收集、统计建模、相关分析、结果论证、创新创业等实践性教学环节,同时尽可能的创造机会让学生去拥有大数据分析业务的企业或者公司去调查研究,实习,以适应大数据的时代要求。
三、结束语
大数据时代,信息技术的快速更新、飞速发展,尽管对统计学的固定探究方式和价值观念带来一定的冲击,但长远来看更多的是带来机遇。这是因为环境的改变和严峻性,统计学要不愿意被淘汰,就必须实事求是,与时俱进,跟上时代发展的步伐,进行改革和发展以及创新。统计人员必须具备职业敏锐性,始终保持终身学习的优良传统,不断得学习、理解和革新新技能。唯有这样,才能在大数据的环境下生存与发展。endprint