胡荣春 马娟
摘 要:目前国家正在全力推进创新创业建设,大力培养创新创业人才。高校是双创人才的培养基地,在国家布局创新创业的环节中占有重要的地位。在当前环境下,高校如何做好创新创业人才培养工作是一项值得研究的重要课题。大数据为双创人才的培养带来了更多更新的思路,文章探讨了大数据为双创人才培养带来的机遇,以及利用大数据技术和工具为创新创业发展及人才培养所带来的好处和优势。
关键词:大数据;创新创业;人才培养
中图分类号:G647 文献标识码:A 文章编号:1002-4107(2021)03-0036-02
一、引言
伴随着科学技术的飞速发展,加上即将全面普及的5G通信技术所带来的超大数据传输量,大数据处理技术已显得越来越重要。一般“大数据”定义为无法在一定时间内用传统数据库软件工具对其内容进行抓取、管理和处理的数据集合,具备大量化、类别多样化和处理快速化等特征[1]。自从数据处理专刊《Dealing with data》于2011年正式出版后[2],“大数据”迅速成为众多领域的研究热点。大数据时代的到来,对行业发展、单位决策、个人日常生活等都将产生巨大的影响。
自从李克强总理在2014年达沃斯论坛提出“大众创业、万众创新”的关键词后,国务院于2015年相继下发了《国务院办公厅关于发展众创空间推进大众创新创业的指导意见(国办发〔2015〕9号)》《国务院办公厅关于深化高等学校创新创业教育改革的实施意见(国办发〔2015〕36号)》《国务院关于大力推进大众创业万众创新若干政策措施的意见(国发〔2015〕32号)》,并为此建立了推进大众创业万众创新的部际联席会议制度(国办函〔2015〕90号),从国家层面全力推进创新创业建设。随后相关部委和各省都相继发文深化开展双创建设。国务院还发布了两批次共120个双创示范基地名单(国办发〔2016〕35号、国办发〔2017〕54号)。2018年国务院再次发文《国务院关于推动创新创业高质量发展打造“双创”升级版的意见
(国发〔2018〕32号)》,将“双创”持续向更大范围、更高层次和更深程度推进,与经济社会发展深度融合,进一步激发市场活力和社会创造力。
高校是双创人才的培养基地,在国家布局创新创业的环节中占有重要的地位。如何做好人才培养工作,为社会输送更多更好的优秀科技人才是高校面临的一项重要课题。人才培养是一個系统工程,内容繁多复杂,包含了培养体系建设、质量评价、过程干预等等,尤其双创人才培养,重点关注人才的创新创业能力,对人才质量的要求更高。大数据处理正为这种复杂的系统工程管理带来了一个新的思路。高校如何在大数据时代下更好地进行双创人才培养,这将是一个值得关注和探讨的问题。
二、大数据为双创人才培养带来的机遇
大数据处理既是一门前沿学科又是一种工具,如同早年的计算机和互联网技术一样,随着计算机技术的发展,人们利用计算机和互联网办公、学习、购物……普通的计算机和互联网应用早已成为人们日常生活中必不可少的一种工具。随着大数据处理技术的逐渐发展,大数据处理本身的应用也必将成为一个方便大家使用的工具。
不同高校的双创人才培养有其各自的侧重点。创新创业的发展方向及投入的重点既可以基于自身的传统优势学科方面,也可以结合地区特色或行业特色,还可以兼顾前沿新兴领域的研究或产业化发展态势。对于决策者而言,信息的及时性和准确性无疑具有重要的作用。在信息缺乏联系和整合的情况下,决策者往往需要花费大量的精力和时间来对创新创业的发展方向和领域进行调研分析和评估,最终确定建设重点。大数据时代的到来为决策者带来了更多的机会和希望,通过大数据分析得到的信息更加准确和具有针对性。在大数据环境下,决策者不仅可以获得常见的相关数据,还有可能得到更具有价值性的信息。例如通过网络爬虫、数据挖掘、云计算及深度学习等技术,可以从公开媒体发布的新闻和各种碎片信息中分析获得不同领域热点之间的横向比较数据,甚至国家或地区潜在的政策转变方向以及重点行业投入的发展趋势等等。
在大数据预测上,谷歌和百度都有过较为成功的案例。谷歌搭建的流感数学模型及预测系统,在2009年发布的冬季流感预测结果与官方数据达到97%的相关度;百度的景点预测系统在2014年准确预测出泰山成为清明小长假全国最拥堵的景区,该事件还登上4月6日CCTV的《新闻直播间》和《晚间新闻》等栏目。
目前各大型互联网公司均致力于开发自己的大数据预测平台,如百度预测、腾讯大数据、谷歌趋势等,包含了经济、疾病、金融、体育、房地产等各方面的预测产品。这些平台的出现无疑为决策带来了一条新的思路,若能将大数据处理和创新创业及人才培养相结合,必将对其产生重要的影响。
三、基于大数据的双创人才培养探索
将大数据技术应用于高校双创人才培养,可以从人才监测、行业需求、热点领域趋势、创业导向等方面来开展。
人才监测方面,可以通过对各方面信息进行分析综合,预测学生在培养过程中不同方面的发展趋势。在如今信息化飞速发展的时代,数据的采集形式越来越多样化,从网上的浏览痕迹,到摄像头的自动人脸捕捉,几乎可以把个体的行为轨迹全部刻画出来。学生情况的数据采集比较容易,最直接的是课程成绩,以及简单易行的调查问卷等。除此之外,还可以通过学生一卡通在食堂刷卡的次数和频率、进出教室打卡的记录、在校园网上的验证登录的IP地址等等信息来判断学生的生活和课堂出勤情况。例如在筛选人才的过程中,某学生长期不出现在教学楼、实验室或图书馆,而监测到的校园网登陆IP地址一直在寝室或校外网吧,则该学生旷课逃学的可能性就很大,基本可以把他从潜在目标培养人才的范围中排除。
行业需求和热点领域趋势是创新创业中非常重要的一环。充分利用物联网和大数据技术,对行业情况和当前热点领域的相关数据进行研究,得到行业发展的趋势预测,为创新创业指明方向。当对行业发展趋势和当前市场的潜在热点领域进行充分研究和分析后,就可为创新创业的领域和题材提供指导性意见。以上这些都需要大数据处理和决策模型的支撑。模型的输入为各类相关数据和指标,模型的输出为行业和热点领域趋势的判决结果。
为综合、直观地反映变动方向和变动程度,可采用数理统计中常用的指数方法将各项监测指标综合集成为监测指数。考虑到监测指标之间存在较强的多重相关性,还可选用主成分分析法来提取核心监测指数。主成分分析法(PCA)的基本原理是利用线性变换的方式将原始指标数据变换到一个新的坐标系统中,实现从多个原始指标到少数综合指标的转变。主成分分析法的优点是在实现数据降维和指标独立的同时,尽可能地保留原始指标的信息。
在模型的构建过程中,为消除不同指标数值的量纲影响,同时又保留各项指标的相对变异程度信息,采用均值法对指标数据进行无量纲化处理。在对指标体系进行主成分分析后,提取出的核心监测指数作为相对量值,既可用于对监测对象进行时间和空间上的相对比较,也可用于监测对象的状态衡量。衡量状态的标准可以是绝对的,也可以是相对的。考虑到目前尚无用于对相关指标进行衡量的权威标准,可以采用基于统计学中常用的正态分布统计方法,建立监测指数的参照状态区间,用以比较监测个体在群体中的相对变化。最终经过仿真分析和筛选,导出最符合实际预期的模型。
利用大数据的相关性,采用数据挖掘技术找出数据背后的隐含信息。数据挖掘是一个利用各种分析工具在海量数据中发现模型和数据之间关系的过程,这些模型和关系可以被企业用来分析风险、进行预测。数据挖掘采用的算法很多,比较常见的有关联规则方式、决策树方法方式、神经网络方法方式、粗糙集方式、遺传算法、模糊论方法和可视化技术等。
决策树分类理论通过构建决策树来实现定性分析。从决策树可以获知,在具有某种优势的群体中,具有另一种优势的人占很大比例,这样可以推断出具有前一种优势的人一般都具有后一种优势。利用决策树分类算法可以分析出不同性质的创业方向一般具有的优势。这样可以根据分析结果提前对创新创业的方向进行规划和判断,提供有力的辅助决策作用。采用K均值算法的聚类挖掘能分析出某一群体的特征行为。应用在行业趋势分析中,可以分析出市场出现萎缩下行或扩张上行等特征。利用这些特征能够预测该行业的未来发展趋势,学校在人才培养上可以提前有意识地培养和布局。
四、结论和展望
大力鼓励和发展创新创业是国家层面的方针政策,培养出优秀的创新创业人才是国家交给高校的一项重要政治任务。如何做好人才培养工作,为社会输送更多更好的优秀人才是高校面临的一项重要课题。如今大数据的出现为双创人才的培养和建设提供了一个新的视角,同时也带来了研究和解决这一问题的新思路和新方法。本文探讨了大数据在双创人才培养中可能带来的机遇,以及利用大数据技术带来的好处和优势。如今,大数据时代已经悄然来临,其对我们日常工作生活的影响也日益显著,谁能在技术的大潮中尽早抓住大数据所带来的机遇,谁就能占得先机,迎来更大的机遇。
参考文献:
[1]Big data:The next frontier for innovation,competition,and productivity[R].USA:The McKinsey Global Institute,2011.
[2]Science.Special online collection:Dealing with data [EB/OL].http://www.sciencemag. org/site/special/data/.
编辑∕李梦迪
作者简介:胡荣春(1981—),男,重庆人,西南科技大学信息工程学院讲师,研究方向:高校人才培养和数据处理。
基金项目:西南科技大学学生教育管理及改革研究项目“大数据时代下的高校双创人才培养质量监测研究”(18sxb117);西南科技大学研究生教育教学改革项目“基于学科评估的地方高校学术型研究生个体培养质量监测平台研究”(20sxb008)