曹朋 成都七中嘉祥外国语学校
引言:统计学在社会生产生活当中应用非常广泛,通过分析统计数据,我们可以得到很多有用的有利于工作的指导性结论,例如金融分析师可以通过统计数据对行业未来发展方向进行预测等。近年来,大数据产业蓬勃发展,通过对海量数据所包含的内容提取和利用,可以社会各行各业的高效快速运行。所以,我们有必要对大数据时代统计学受到的影响进行分析。
顾名思义,大数据就是包含了数量极大的信息和数据,通常不能由单个计算机或者数据库来管理、处理,必须借助分布式的数据库存储系统和云计算等新型技术对其加以利用,它具有大量、高速、多样和真实等特点。
统计学是一门通过处理数据来提高我们对客观事物群体认识甚至预测未来发展方向的一门学科,广泛应用于社会科学和自然科学各个领域。如果没有统计学,数据将会失去意义,只有通过统计学的方法论,将数据解释出来,才能显示出数据巨大价值。
统计学的发展具有很长的历史,大数据是现代信息社会的产物,但是两者仍然有很多的联系。统计学的研究过程为:统计方案设计、数据搜集、数据整理、数据分析、得出相关规律和结论,而大数据的利用过程为:采集数据、统计分析、挖掘信息、利用信息,两者在过程上有较大的相似之处。统计学的相关理论方法和思想被运用到大数据分析中,同时,大数据相关软件也在一定程度上丰富了统计学的研究工具,为统计学搜集数据带来一定便利。另外,大数据和统计学都集合了社会、数据、哲学、数学和方法等概念,将定性分析和定量分析相结合,用于解决社会问题。某种程度上,两者也是相互依存的,没有了统计学,大数据无法运作,离开了大数据,统计学对将不能满足现代社会的发展需要。
但是,大数据和传统统计学还存在很大的区别,在信息规模和组织结构、处理方法、动静标准、搜集形式、思维方式、研究目的等方面存在差异。传统统计学通过抽样调查得到有限数据,然后用样本单位来估计整体特征,取得的也是相对容易整理的结构化数据,可利用概率论、相关回归等理论进行分析,而大数据的样本则是几乎等于总体,里面包含了大量各种各样的信息和特征,并且是非结构化和半结构化的,只能通过现代计算机和网络技术进行分析。通过抽样调查得到的统计学数据都是静态,且非即时的,而大数据是实时动态变化,其对现实的反映程度更高。搜集形式上,抽样调查大多通过线下线上等多种方式进行,而大数据一般只能通过互联网获取。思维方式上,传统统计学更追求的是事物之间的因果关系,而大数据在此基础上,还能分析事物之间的相关关系。在研究目的上,大数据更多的以实现价值追求为目的,而统计学更多的以研究社会现象为目的。
大数据的出现,对传统统计学的应用领域构成了一定的挑战。传统的统计学需要抽样调查,在搜集数据上存在一定的困难并需要花费大量时间,在大数据时代,人们为了简便,很多时候就直接从互联网流量数据上去搜集信息,以达到快速高效的目的,比如用于某些选举的人气支持率调查、商品的受欢迎程度调查等,并且随着大数据的发展和计算机软硬件的功能越来越强大,其作用会更加凸显出来。但是,这样存在一定的弊端,在某些领域,数据分布可能是相对均匀的,然而,在另外一些领域,样本则存在一定的选择性,因为互联网的使用群体更倾向于年轻人,使用地域更倾向于网络通信发达和开放程度更高的国家和地区,因此得到的结论可能具有一定的片面性。
传统的统计人才培养方式已经不再适应大数据社会的发展,主要体现在教师知识结构、教学内容和教育模式上。现在大部分教师只擅长理论公式推导、模型构建以及统计应用等,不太了解计算机和互联网的新兴技术,因此在教学中,很难将这些技术灌输给学生,而这些技术正好是大数据时代所需要的。大部分学校的统计专业培养计划也更偏重于理论知识,涉及到大数据处理、计算机分析和应用的课程比较少。另外,当前学校的培养模式也存在一定的问题,以老师讲课为主,看重理论知识,对于学生的实践能力、社会视野、和商业意识的培养还很不到位,而这些能力对于现代统计分析人员是非常重要的。所以,在人才培养上,学校应该结合大数据时代的特征,在教师知识体系、教学内容和培养模式方面进行一定的改进。
总结:大数据时代的来临,单纯的传统统计学已满足不了现代社会的需要,但是我们在认识他们之间区别的同时,要将这两者联系起来,结合运用,在不同的领域发挥出各自的优点。我们还要认识到大数据时代带给统计学应用和人才培养方面的挑战,通过相关改进培养出有统计学基础的大数据人才,创造出迎合大数据的新统计学方法,促进统计学的发展。