大数据背景下基于R语言的数据分析能力培养研究

2019-12-13 07:22侯县平
卷宗 2019年32期
关键词:R语言案例分析大数据

侯县平

摘 要:基于大数据背景下对数据分析能力的要求,结合R语言的优势,提出基于R语言的大数据案例分析是综合培养和提高大数据背景下数据分析能力的有效方法,并通过有效评价来不断提升培养效果。

关键词:大数据;R语言;数据分析能力;案例分析

大数据(big data)时代,超乎想象的海量数据正在以前所未有的速度持续不断地产生、增长、变化和更新。大数据已经成为重要的生产资料和战略资源,正在改变着人们的思维模式,企业的运作模式和社会的管理模式[1],也成为各方面关注和争夺的焦点。然而,大数据的真正价值并不在于数据庞大,而在于大数据背后隐藏的有用信息。要让大数据真正发挥作用,必须要通过大数据分析挖掘出这些有用的信息并加以合理应用。随着移动互联网和物联网的广泛普及和深入应用,大数据已渗透到经济、社会、生活的方方面面,改变着人们的生产生活方式,助推各个产业转型升级,而大数据分析的需求也越来越多,对数据分析人才的需求也快速增加。但由于大数据的异构性、规模性、实时性、复杂性和隐私性等特点,使得数据分析变得困难,因而对数据分析技术和数据分析人才提出了更高的要求[2]。

大数据时代背景下的数据分析人才,既要懂得数据分析的理论和原理,也要掌握并灵活运用数据分析的方法和工具,才可能满足大数据分析的要求。大数据时代背景下的数据分析人才培养,也必须要面向大数据分析的市场需求,这对数据分析人才的实践能力的培养提出了更高的要求。统计学是通过收集数据、分析数据而得出结论的一整套概念、原则和方法,是进行数据处理和分析的理论基础,是培养学生数据分析理论素养的重要课程和途径。R语言是一种免费统计软件,具有强大的统计计算能力、数据处理和分析能力以及开放性、应用广泛等特点,这使得在统计学教学中基于R语言提高学生的数据分析能力,以满足大数据时代对数据分析人才的需求,成为了一种可能。

1 大数据背景下数据分析能力的要求

大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合[3]。大数据可以在个人、企业、行业、政府等各个层面开展广泛的应用。例如,基于个人医疗健康大数据指导人们的就医和运动,企业运用大数据进行精准营销,政府可以通过公共大数据进行交通管理等。一个典型的案例是沃尔玛超市通过数据分析发现了看似无关的啤酒与尿布之间隐藏的关联关系,从而将尿布和啤酒放在一起销售,使得两者的销量都大大增加,取得了巨大的成功。大数据在金融、医药、教育、社会科学、环境保护、气象服务、军事、农业等诸多领域正在得到日益深入的应用[4]。2015年国务院印发了《促进大数据发展行动纲要》,2016年《国民经济和社会发展第十三个五年规划纲要》提出实施国家大数据战略,这进一步推动了大数据的蓬勃发展和广泛应用,对数据分析人才的需求也更加旺盛。

大数据背景下的数据分析人才,必须要掌握扎实的数理理论基础,宽广的管理学、经济学等知识,娴熟的计算机操作技能,具备较强的数据调查获取能力,数据处理分析能力,软件应用开发能力,以及针对实际问题提出解决方案的能力,能够为个人、企业和政府的决策提供数据支持,提高决策的科学性。

然而,传统的重理论、轻实践、轻技能的教学已经不能满足大数据背景下人才培养的要求。大数据背景下的数据分析人才培养,需要理论与实践并重,重点加强实践能力。而数据分析能力的一个重要体现就是熟练掌握有效的数据分析方法和工具,并能够在理论的指导下熟练应用于大数据分析实践当中。因此,大数据背景下数据分析能力培养要紧紧与当前如火如荼的大数据实践相结合。

2 大数据背景下数据分析工具R语言的优势

至少熟练掌握一种优秀的工具,成为大数据背景下进行数据分析的必然要求。R语言是一款功能强大的统计计算和图形编程语言,根据两位主要开发者Ross和Robert的名字首字母而得名,其前身为1976年美国贝尔实验室开发的S语言。R语言具有如下优点:

1)自由共享性。R语言是一种开源的免费统计软件,任何人都可以自由地共享使用。

2)分析方法丰富。R语言提供了各种各样的数据分析技术,不仅囊括了众多经典的数据分析方法,而且大量面向不同领域的最新分析方法也在其中,并且快速的发展和更新。

3)高参与性。R语言是一个开放的网络社区平台,各行各业的用户都可以参与到R的开发中,形成一个相互交流协作的开放型组织,共同丰富和完善R的功能,共享R的成果。

4)可兼容多种数据类型。R可以轻松的导入多种类型的数据,如文本文件、Excel,SPSS,SAS,Stata数据等,还可以从网页、网站中获取数据,十分方便。

鉴于此,R语言发展很快,从学术界到业界都得到广泛使用,成为大数据背景下进行数据分析、提高数据分析能力的有力武器,也成为支持大数据时代数据分析能力培养的理想工具。

3 大数据背景下基于R语言的数据分析能力培养方法

大数据背景下,数据分析能力的培养应面向市场需求、注重实践应用、重在解决问题。因此,在重视理论教学的同时,结合大数据分析案例进行教学,成为全面培养提升学生数据分析能力的有效方法。学生可自由组合成为若干组,每组选择一个主题的大数据案例进行研究分析。

大数据案例应选自当前如火如荼的大数据实践,这些案例基于当前的市场需求,能够解决实践中的问题,具有极强的应用价值,因而能够极大的激发学生的学习兴趣。分析大数据案例,一个首要问题是如何获得数据,从哪里获得数据,需获得怎样的数据。在解决数据获取问题的过程中,数据的搜集能力得到了训练,也对大数据背景下数据的复杂特征会有深入的理解。一般来说,得到的原始数据并不能够直接拿来分析,需要对其进行有效的处理,将其变成可用的数据。在这一过程中,学生需要思考,数据应处理成什么样的,如何处理這些复杂的数据,并实现这一目标,从而数据处理能力得到了良好的锻炼。数据处理成可用的数据后,需运用什么理论、什么方法、什么模型分析数据,才可能得到想要的结果,如何实现相应的算法,这都要不断的实践。数据分析出初步结果后,是否正确,还需要核实和检验。在这一过程中,数据的分析技能得到了良好的锻炼。在得出数据分析结果后,需要根据问题的实际背景和相关的理论,得出相应的结论,并提出解决方案或对策建议。在这一过程中,学生的分析问题、解决问题的能力得到了锻炼。最后,还要根据整个处理分析过程及结果,撰写完整的数据分析报告,并进行公开交流。在这个过程中,学生的写作能力、表达能力都得到了较好的训练。一个较大的案例分析,可能涉及的内容较多,必须要同组同学之间协同才可能完成,因此,学生的团结协作能力也得到了锻炼。整个案例分析完成后,各个组之间完全共享自己的成果,同学们可以相互借鉴学习,从而可以拓展、提升案例分析的能力。与此同时,在整个案例分析过程中,离不开数据分析工具的应用,借助于R语言这一理想工具,能够帮助学生很好的完成数据搜集、处理、分析等工作,提高软件编程和应用能力,提高模型和算法的实现能力,很好的完成案例分析工作。通过大数据案例分析,为更深入的学习和提高大数据分析能力打下坚实的基础。

4 大数据背景下基于R语言的数据分析能力培养评价

基于大数据案例进行数据分析能力培养的效果,需要进行有效的评价,以便进一步改进教学方法,提升教学效果。评价方法上,应采用老师与社会评价相结合、课内与课外评价相结合的方法。老师通过学生基本理论、基本方法、基本技能的掌握情况,大数据分析案例完成的情况进行综合评价。老师积极引导学生参见数据分析的实践活动,通过学生在活动中的表现来综合衡量数据分析能力培养的效用。也要积极收集用人单位对学生数据分析能力的评价。通过课内与课外、老师与社会的评价,综合评判培养效果。在评价的内容上,则应对数据收集、数据处理和分析、数据解释、数据分析报告、方案建议、工具应用等方面进行重点评价。通过有效的评价, 发现不足,不断改进培养效果。

5 结论

大数据背景下,对数据分析能力提出了更高的要求。R语言成为大数据背景下进行数据分析的有力工具。基于R语言,通过大数据案例分析,成为提高数据分析能力的有效方法。进而,可通过有效的评价,不断改进培养效果。

参考文献

[1]刘建义.大数据驱动政府监管方式创新的向度[J].行政论坛,2019(05):102-108.

[2]任南,鲁丽军,何梦娇.大数据分析能力对协同效应的影响机理研究[J].科技管理研究,2018,38(11):180-187.

[3]http://www.sic.gov.cn/news/574/9190.htm

[4]周曙东.我国大数据产业统计范畴的分析与探讨[J].调研世界,2017(12):49-52.

猜你喜欢
R语言案例分析大数据
基于GPS轨迹数据进行分析改善城市交通拥挤
基于R语言的Moodle平台数据挖掘技术的研究
父亲缺失案例分析
冷库建筑火灾特点及调查方法研究
让语文课堂评价语绽放异彩
注重统计思维培养与应用为主导的生物统计学课程建设