神经网络领域最早是由心理学家和神经学家开创的,旨在寻求开发和检验神经的计算模拟。神经网络是一组连接的输入/输出单元,其中每一个连接都与一个权重相关联。神经网络可以分为两个阶段,第一个阶段是学习阶段,通过调整权重,使得能够预测输入元祖的正确类标号,第二阶段为预测阶段,使用生成好的神经网络模型进行预测[1]。
神经网络的优势包括其对噪声数据的高承受能力,以及对未训练的数据的模式分类能力,劣势在于可解释性差。
Clementine软件采用可视化编程思想,提供了大量的人工智能、统计分析的模型,可将数据挖掘流程转化为一个数据流,每个数据流由一系列结点组成,为每个结点指定操作,就可以完成数据流的执行[2]。结点被划分为七个栏,分别为源、记录选项、字段选项、图形、建模、输出和导出。
校园贷预测模型建立可分为两个过程,首先是神经网络模型的训练过程,其次是使用训练好的神经网络模型进行预测[3]。下面分别从这两个过程分析模型的建立步骤。
1.神经网络模型的训练过程
步骤1 在软件Clementine中选择源结点中用于读取Excel数据(训练集)的结点并配置数据来源;
步骤2 在字段选项中选择类型结点,并配置数据列的类型和方向;
步骤3 在建模选项下选择神经网络结点并配置参数;
步骤4 连接新建立的3个结点并执行数据流,数据流如图1所示,生成的神经网络模型如图2所示。
2.使用训练好的神经网络模型进行预测
步骤1在软件Clementine中选择源结点中用于读取Excel数据(测试集)的结点并配置数据来源;
步骤2在字段选项中选择类型结点,并配置数据列的类型和方向;
步骤3 选择训练好的神经网络模型;
步骤4 选择输出选项中的表结点;
步骤5 连接新建立的4个结点,形成的数据流如图3所示。
图1 神经网络模型训练数据流图
图2 神经网络模型图
图3 神经网络模型预测数据流图
将样本分为训练集和测试集两部分,训练集占80%,测试集占20%。使用训练好的神经网络模型在测试集上预测,将得到的结果进行处理,取阈值为1.7,将小于阈值的归为会使用网贷类,将大于等于阈值的归为不会使用网贷类,将实际值与预测值汇总,得到的结果如表1所示。
表1 预测分类与实际分类图
表1续 预测分类与实际分类图
经计算预测准确度达到88.9%,达到了较好的预测效果。
文章以重庆工程职业技术学院范围内得到的调查问卷为基础,利用Clementine软件建立了神经网络模型,并在测试集上对模型的预测效果进行验证,测试结果显示准确度达88.9%,证明使用神经网络模型预测大学生是否会使用校园贷是可行的。