基于数据挖掘的应用型高校创新创业数据分类方法

2022-07-07 05:46尧雪莉
数字通信世界 2022年6期
关键词:数据挖掘应用型分类

尧雪莉

(南昌交通学院,江西 南昌 330100)

0 引言

近几年来,高职院校应用型人才培养得到了各个行业的重视,创新创业教育成为职业教育人才培养的主流趋势[1-2]。在教育过程中将创新创业数据进行有效的分类对教育方案的制定具有重要意义。但是由于市场需求的变化,应用型高校对学生创新创业数据的分类结果无法达到预期的标准,需要设计更加灵活、多变的数据分类方法[3-4]。

数据挖掘对于庞大数据的处理效果更佳,处理形式也较为灵活。本文基于数据挖掘技术提出应用型高校创新创业数据分类方法。与传统的数据分类模式相比,本文所设计的数据分类方式创新性地在复杂的处理环境之下,明确划定数据处理区域;结合所设立的创新创业执行目标,核定更加精准的分类结果;在数据挖掘的辅助支持之下,提升了整体的数据分类处理效果。

1 数据挖掘下应用型高校创新创业数据分类方法设计

1.1 数据分布预处理

在对应用型高校创新创业数据进行挖掘分类之前,需要先进行数据分布的预处理[5]。结合应用型高职院校的创新创业实际情况,划定具体的数据处理区域,提取数据的分布特征,在预设的标准以及范围之内,进行融合归类[6]。构建的对应的分布处理结构如图1所示。

图1 数据分布预处理结构图示

根据图1,可以建立数据分布预处理结构。依据该结构,结合数据挖掘技术,进行分布目标的关联;在合理的分布范围之内,完成对数据分类目标的项集预处理。

1.2 设定特征数据分类目标

在完成数据分布预处理之后,需要设定特征数据的分类目标[7]。特征数据分类目标是指通过提取数据特征划定具体的分类层级。需要注意的是,数据分类层级一般由分类目标驱动,结合挖掘指令,形成对应的分类任务[8]。此时,结合上述内容计算创新创业数据特征分布权系数:

通过上述计算得出实际的数据特征分布权系数,排除存在的差异值,设定具体的应用数据分类目标,为后续挖掘处理奠定基础。

1.3 模糊数据挖掘分类结构设计

基于上节设定的特征数据分类目标,设计模糊数据挖掘分类结构。先结合数据的实际数量,预设数据的实际分类范围,将测定数据的模糊特征分布集设为在[-1,1]的区间之内,划定数据挖掘的实际应用范围。

同时,根据特征模板,设定分类控制指数,在特征权重回归分析的基础之上,构建多层级、多目标的自适应分类结构;结合分类目标,完成模糊数据挖掘分类结构设计。

1.4 双向关联数据挖掘分类模型构建

根据模糊数据挖掘分类结构,构建双向关联数据挖掘分类模型。划定基础的分类条件与处理标准,计算数据分类模型的双向挖掘比:

基于双向关联规则,对数据进行模糊统计;设定高层级的数据分类序列,在每一个分类处理序列之间划定允许出现的误差标准为0.15。数据分类自适应度函数计算如下:

1.5 基于特征重构法实现应用型高校创新创业数据分类

基于双向关联数据挖掘分类模型,采用特征重构法实现应用型高校创新创业数据的分类。基于数据挖掘技术,设定重构边缘范围,同时制定重构分类边缘值,具体如表1所示。

表1 重构数据分类边缘值标准设定表

根据表1设定重构数据分类边缘值标准,实现数据挖掘技术下应用型高校创新创业数据的分类。

2 方法测试

验证数据挖掘下应用型高校创新创业数据分类方法的分类效果,设定3个测试组进行对比测试。测试组1为传统的线性回归数据分类处理方法;测试组2为传统的物元数据分类处理方法;测试组3为本文设计方法。

2.1 测试准备

选取R高职院校作为实验对象,设定P高职院校的4个班级作为测试对比小组。采用Matlab和C++的混合处理方式进行数据初始分类架构的设计与构建,并计算出实际的互动限制比:

结合限制比,设定对应的初始测试区域。结合数据分类样本,计算出控制权重系数:

在测试之前,根据测定的范围和创新创业数据的数量,设定数据分类的迭代次数为650,测定周期为6周,标准完成比为T=0.25。在数据挖掘的辅助支持之下,设定数据的分类目标。将整合的P高职院校4个班级创新创业数据依据种类添加在不同的处理层级。

结合数据挖掘模式,构建二次数据分布的不规则空间聚类数据处理模型,构建模糊的数据分类环境,计算出具体的数据挖掘模糊系数:

2.2 测试过程及结果分析

在搭建的测试环境之中,根据数据挖掘所覆盖的范围,进行空间聚集分类测定。先获取相应的聚类数据处理信息,同时建立对应的分类结构,进行数据聚类收敛比的计算:

根据图2,可以完成对创新创业数据波动变化的掌握。随后,结合R高职院校的实际数据分类要求,以及创新创业的变化范围,计算出实际的误分率:

图2 数据波动变化图示

式中, 表示实际的误分率; 表示迭代挖掘次数; 表示模糊分类均值。通过上述计算,最终得出3个测试组的实际误分率结果如表2所示。

表2 测试结果对比分析表

根据表2,与传统测试组相比,本文所设计方法得出的误分率相对较低,表明其对于P高职院校的创新创业数据的分类效果更佳,具有实际的应用效果。

3 结束语

为了提高应用型高校创新创业数据的分类效果,本文设计基于数据挖掘的应用型高校创新创业数据分类方法。设定具体的分类目标,结合应用型高职院校的创新创业需求与标准,制定相应的分类处理方案,优化数据分类结构。实验结果表明本文方式更加灵活,可以在复杂的创新创业环境之下,提升数据处理的效果,推动创新创业目标更快实现。■

猜你喜欢
数据挖掘应用型分类
改进支持向量机在特征数据挖掘中的智能应用
关于应用型复合人才培养的教学模式探讨
应用型本科层次大学生网络在线学习策略及实践
分类算一算
探讨人工智能与数据挖掘发展趋势
基于事故数据挖掘的AEB路口测试场景
教你一招:数的分类
说说分类那些事
软件工程领域中的异常数据挖掘算法
给塑料分分类吧