商瑶(太原理工大学软件学院、太原理工大学现代科技学院)
传统高校农村贫困生识别都是人工统计、手工操作再进行筛选,难免出现统计误差和人为因素干预,而本文采用深度学习算法对高校农村贫困生进行精准识别,构建高校农村贫困生资助评定系统,进而简化高校农村贫困生评定工作,提高了准确率和效率,减少了师生之间的不必要摩擦,促进智能高校校园建设。
本文将以现场实验的方法,对深度学习的神经网络系统的功能性进行深入挖掘,以验证深度学习在农作物病虫害识别中的实际应用效果。该实验中操作系统的配置参数为:Ubuntu-Linux 16.04 64 位,VSCode-win32-x64-1.30,OpenVINOTM。 计算机的中央处理器采用英特尔凌动TMX5-Z8350 处理器,硬件开发板的配置参数为4GB DDR3L RAM 和64GBeMMCUP Board,数量为一块;英特尔神经计算棒二代一个,内存条选用IntelCore(TM)i5-5200UCPU@2.20GHz/4G,固态盘的容量大小为128G,笔记本电脑一台,免驱动摄像头一个。而该操作系统的软件环境则由Python3 语言环境、Caffe 深度学习框架、ps6 绘图软件以及OpenVINOTM 开发工具箱组成。
该系统在启动后,操作终端的默认运行环境为python,而pip 执行命令主要借助于Caffe 所依赖的包,主要涵盖pandas、glob2、numpy 等,并利用pip 执行命令来安装caffe。在互联网运行环境下,操作人员可以操作终端界面通过解压缩的形式来下载tarball,将配套的组件安装在运行系统当中。然后开始配置神经计算棒的驱动程序,如果系统在正常运行状态下,操作终端出现demo completed successfully 的字样时,则可以确定神经计算棒的开发运行环境的构成条件已经达成,接下来对系统的运行过程进行细致分析[1]。(一)打开神经计算棒的句柄
如果系统具备较强的学习功能,首先需要确定神经计算棒的准确位置,这时,系统程序员利用编制好的程序在系统当中探寻神经计算棒的位置,在这一过程中,如果操作终端持续不断的提示神经计算棒未找到的字样或者声效,操作人员应当及时检查系统的配置情况是否符合深度学习模型构建的要求,同时,对系统连接状态进行认真校验,当确认连接无误后,能够快速确定神经计算棒所处的位置,这时,操作人员可以打开神经计算棒的句柄,随即进入下一道操作工序。
(二)数据预处理
当神经计算棒的句柄打开以后,操作人员将需要识别的人员信息等基本情况导入缓冲区,被处理对象通过神经计算棒的推理运算功能而形成一个统一排序的列表,系统根据字母排序创建运行目录,进而对需要导入系统内的图像进行预处理,经过处理后的数据不占用内存空间,而且数据的大小可以随时进行调整,借助于计算机的平均减法等算法对相关数据进行处理和运算。
(三)执行结果推断与打印
执行结果的推断与打印是深度学习的最后一个处理阶段,首先被处理后的数据信息被转变成为半精度的浮点数,此时,英特尔神经计算棒能够根据浮点数及时获取准确的数据结果,然后进入到打印程序,当分析结果打印完毕,操作人员应当制裁桌面图标,并使系统保持在关机状态。
(一)流程图
高校农村贫困生精准识别的流程如图1 所示。对贫困等级精准识别并建立评定的数据模型主要包含:
(1)从校园一卡通、学生信息、学校教务等系统中依据专业和年级对学生信息进行提取,并将提取的数据作为原始的数据。
(2)整体分析所提取的数据,剔除与高校农村贫困生等级精准识别的无关属性列。
(3)对优化的提取数据进行前期预处理,包括提炼数据源中的重要文本信息、异常和缺失值的分析处理、冗余属性统一以及处理规范化等。
(4)数据处理后,建立贫困等级精准识别及评定的模型,对构建的模型进行模型训练及评价分析。
(5)对上面形成的模型结果对比并进行深入优化。
(6)调用高校农村贫困等级精准识别及评定模型,动态实时测评高校农村贫困生基本情况。
(二)数据选取方法
为了满足高校农村贫困生精准识别及资助的需求,从以下几个方面进行数据选取。
首先,贫困生家庭贫困情况是高校农村贫困生识别的重要依据。目前全国各地区仍然具有不平衡的经济水平,东部沿海地区仍然高与中西部地区,特别是长江三角洲和珠江三角洲地区,家庭年收入远高于其他地区,家庭的整体经济水平良好,因此地区的经济水平高低是高校农村贫困生识别和认定中的核心指标。其次,消费行为是高校农村贫困生识别的又一标准,家庭贫困程度的高低直接影响消费能力的好坏,也就是说贫困家庭的学生消费能力也差,限制其日常的消费。因此校园一卡通中消费记录功能可以很好的反映学生消费情况,为贫困评定提供有力支撑,所以将交易的地点金额类型作为高校农村贫困识别和认定的第二指标。最后,农村贫困生的传统认定方式仅仅改善贫困生的经济情况,并未考察贫困生德育方面,一些贫困生会因此有怠惰行为,理所当然享受国家的贫困资助政策,更有严重不珍惜此类的教育机会,对资助金进行肆意挥霍,最终肄业在家。因此第三个贫困识别和认定指标就是德育方面。因此将补考情况、课程成绩、学分比重、出勤率、图书借阅等数据表明贫困生的具体学习情况。
(三)数据分析
作为深度学习的一个重要步骤,数据分析是预处理的前奏,也是对数据进行挖掘从而获得准确有效结论的基础。其主要包含缺失值、不一致、异常值这三个方面来核查抽取数据是否有脏数据。
1.缺失值分析
数据的缺失主要有这几种情况,首先是记录的缺失,其次是缺失记录重要文字信息,这两种数据缺失的情况,严重影响结果分析的正确性。数据缺失值的产生有两个原因:首先,提取准确信息很繁琐或者无法及时提取信息,比如贫困生相关上网信息;其次,信息输入时由于人为因素、非人为因素(数据采集设备或者存储介质故障)等等而丢失,比如入学初学生自己填写自己的个人信息情况,就有可能漏填或者不清楚具体信息而空白不填情形,出现部分值的缺失。
2.异常值分析
异常值分析的重要目的是检验数据,对录入错误和不符常理情况是否存在进行判断,异常值的分析和剔除可以更好地优化模型。通吃情况下只有个别值属于异常值,异常值分析方法一般有简单统计计量和箱型图分析两种。
3.一致性分析
一致性分析的重要目的是数据准确性的确保,降低数据的不相容及矛盾的产生问题,导致违背实际的后果。主要是在集成过程中产生的数据不一致,原因主要是提取数据的数据源不同,或者数据格式单位类型不同等,在下一次数据存放时未更新数据的一致性。
通过上述实验可以看出,目前,利用卷积神经网络构建的深度学习模型已经日渐成熟,完全可以在高校农村贫困生的精准识别当中推广应用。但是,在实际应用过程中,也暴露出一些亟待解决的问题,比如系统硬件的选择与配置极易对学习效率产生负面影响,因此,技术人员应当不断对卷积神经网络系统进行升级改造,以提升高校农村贫困生的识别精度,提高贫困资助的准确率和效率,简化贫困资助程序,为高校农村贫困生精准资助提供强大的技术保障。