基于BP 神经网络和数据挖掘的情感分析与心理预警模型研究

2023-10-21 06:10朱佳雯
电子设计工程 2023年20期
关键词:数据挖掘神经元预警

朱佳雯

(西安航空职业技术学院,陕西西安 710089)

近年来,心理疾病在大学生群体中出现的频率越来越高,并由此导致恶性事件的发生,这不仅对家庭,也对学校和社会造成了一定的负面影响[1]。目前越来越多的高校开始重视学生的心理健康教育与指导工作,并对存在心理隐患的学生进行积极的引导及干预。但其中大部分高校仍是基于人工处理的方式来发现心理问题。该方式准确率较高但效率偏低,尤其是在面对海量数据时,其处理能力有限。此外,还有部分高校引入了一些数据分析算法,虽可保证处理效率,但仍难以达到分析准确率的要求[2-4]。

基于上述问题,该文基于BP 神经网络(Back Propagation Neural Network,BPNN)和数据挖掘(Data Mining,DM)技术设计了一种智能化的高校学生情感分析与心理预警算法。该算法能在保证处理效率的同时,有效提高心理问题预警的准确率。同时功能性实验与性能测试也充分验证了,所提方法的有效性与稳定性。

1 理论分析

数据挖掘是指从大量有噪声、不规则的原始数据中,获取之前未知且对用户有价值信息的过程[5]。也可理解为是从包含海量数据的数据库或数据系统中,提取并分析数据间无法被轻易发现的隐藏关系,并给用户反馈有用信息的技术。该文采用的数据挖掘过程框架由数据准备、数据挖掘及结果评估与展示三个模块组成[6],具体如图1 所示。

图1 数据挖掘基本过程

图中展示了通过数据挖掘将原始数据转换为可用知识的过程:

1)数据准备是整个数据挖掘过程中最基础且工作量最大的环节,通常其所占比例在50%~70%之间。该模块又可细分为数据采集、数据筛选、数据预处理及数据转换四个阶段[7]。其中,数据采集是指从网站论坛等相关渠道获取未经加工的原始数据信息,并将其放入数据库中。数据筛选是指根据数据挖掘任务需求确定挖掘计划,再从数据库中提取出符合数据挖掘需求的数据。而数据预处理负责对筛选数据中存在的异常加以处理,例如数据冗余、数据缺失和数据不标准等。对应的处理方法包括:数据去重、数据插值与数据标准化[8]。数据转换则负责对数据进行规范化处理,使之更易被计算机识别,进而提高数据挖掘的效率。常见的操作包括连续与离散的数据转换、归一化处理等。

2)数据挖掘是整个过程的核心部分,其主要在经过处理的数据集基础上建立数据模型,并利用相关数据挖掘算法对模型进行训练与优化。目前常用的数据挖掘算法主要可分为两大类:人工智能型算法和统计学分析型算法。其中,人工智能型算法以机器学习(Machine Learning,ML)、神经网络理论为基础,通过训练集对模型的学习与训练来不断优化网络参数,并得到所需的模式。此类算法包括支持向量机(Support Vector Machine,SVM)、K-means 聚类(K-means Clustering Algorithm)以及BP 神经网络等算法[9-11]。统计学分析算法则是建立在统计学基础上、旨在发现大量数据内在联系的一种算法,其主要包括[12]因子分析法(Factr Analysis)、相关性分析以及概率与判别分析法等。

3)经数据挖掘能够得到数据的预测结果,该结果通常需要与实际结果进行分析与评估才能获得最终结论。再通过文字、图表等方式可视化地展示给用户,方可进行后续操作处理。

BP 神经网络是在传统人工神经网络(Artificial Neural Network,ANN)的基础上发展而来的一种多层前馈型神经网络,其最显著的特征是误差反向传播(error Back Propagation,BP)[13]。该文设计的BP神经网络工作流程可划分为两部分,即数据信号正向传递与误差信号反向传递。网络中每个训练样本均包含原始信号值及期望信号值,具体数据处理流程为:数据信号通过网络的输入层进入网络,经输入层处理后再将输出作为隐藏层的输入,并最终传递给输出层进行数据的逐层处理。若输出层输出的结果无法满足预先设定的期望值,BP网络将会进入反向传播过程。在此过程中,网络可通过实际值与期望值之间的误差来不断调整自身所涉及的各项参数,直至误差维持在一定范围之内为止。

如图2 所示,该文采用的BP 神经网络结构设计与其工作流程相关,主要由输入层、隐藏层以及输出层组成[14-16]。其中,位于输入层与输出层之间的隐藏层可根据实际情况设置为多层,同时该层与外部不存在直接连接。网络中每层神经元仅与相邻非同层的神经元相连,而与同层神经元相隔离。网络在对训练集进行处理的过程中,将不断学习与获取输入样本的特征与规则,并利用这些数据不断更新神经元节点间的连接权值。

图2 BP神经网络结构

2 算法理论设计

2.1 算法流程

该文的研究旨在提出一种情感分析与心理预警算法来实现对高校学生心理状态的有效监测,从而便于管理人员进行人工干预等处理。为此,在对BP神经网络和数据挖掘技术进行深入研究的基础上,提出了基于两种技术相结合的情感分析与心理预警算法。该算法进行心理健康数据挖掘的流程如图3所示。

图3 心理健康数据挖掘流程

该流程可描述为:通过可视化操作界面选择待处理的原始心理数据;通过数据筛选、数据预处理及数据转换等步骤将原始数据处理成能够被计算机识别的规范化数据;利用BP 神经网络数据挖掘算法从处理后的数据中获取心理数据间所隐含的关系及其他有价值的信息。

2.2 总体架构设计

在上文算法流程的基础上,设计了图4 所示的情感分析与心理预警算法架构。

图4 情感分析与心理预警算法架构

该算法在整体上可以分为三层,即数据存储层、数据处理层以及界面展示层。其中,数据存储层是整个架构的最底层,其包括原始和经处理后的心理数据存储及预处理;而中间层是数据处理层,该层由数据挖掘引擎与支持向量机所组成,并负责心理数据隐含知识的挖掘及对结果的分类分析。最顶层则是界面展示层,其负责为用户提供人机交互界面,用户可通过该层发送心理问题分析与处理请求,而计算机则通过该层将数据处理结果可视化地反馈给用户。

2.3 网络结构设计

BP 神经网络数据挖掘结构的设计主要在于对隐藏层层数的确定,该网络输入层与输出层通常仅有一个,而隐藏层则可以有多个。在处理复杂问题时,多个隐藏层的叠加虽然能够提高模型的精度,但同时也为网络带来了更高的时间与空间复杂度,使得模型在训练过程中占用较多的计算机内存且消耗更长的处理时间。基于上述考虑,该文设计了输入层、隐藏层以及输出层融合为一层的网络结构。

确定网络结构后,下一步则需确定各层神经元节点的数量。由于输入层与输出层是与外部数据进行信息交换的接口,所以应根据实际情况而定。该文的研究对象是高校学生的心理问题,因此各设置一个神经元。而隐藏层的神经元节点数量则通过被广泛使用的试凑法来确定,该方法的具体数学表达式如下:

式中,x和y分别代表隐藏层神经元数量的下界与上界,m、l分别为输入层及输出层的神经元个数,z则是隐藏层的神经元个数。在应用中,首先确定模型的训练次数;然后,用同一训练集对隐藏层取[x,y]个神经元节点的模型加以训练;再对比隐藏层在不同节点得到结果的误差与时间并选择其中最优的值,该值即为最终隐藏层的神经元节点数。

为了提高BP 神经网络模型的收敛速度和精度,在计算传统神经网络连接权重的基础上,引入了调整因子来对各层神经元间的连接权重进行修订,修订后的公式如下:

式中,Δω(i)为修订后的连接权值;σ是学习率;ε表示实际值与期望值之间的误差;o为网络的输出值;α是引入的调整因子,其范围为[0,1];Δω(i-1)则为连接权值的前一次修订值。调整因子的引入使得模型在训练过程中不会出现大幅度摆动,由此增强了模型的收敛速度,并提高了模型精度。

为进一步优化式(2),需确定最优的调整因子。在心理预警模型训练的过程中,分别给调整因子赋值0.4、0.5、0.6、0.7、0.8 和0.9。根据结果发现,当调整因子为0.8 时,心理预警模型的收敛速度最快且精度符合后续处理需求。因此该文将调整因子设置为0.8,优化后的公式如下:

3 实验与分析

为了验证文中基于BP 神经网络和数据挖掘的情感分析与心理预警算法的可行性及有效性,以某高校采集的数据集为样本,并在其原有心理数据采集系统的基础上引入了所提算法。同时,搭建了基于BP 神经网络和数据挖掘的情感分析与心理预警平台,且在该平台上进行了实验。

3.1 开发环境

平台所涉及开发环境的各项配置如表1 所示。

表1 开发环境各项配置

3.2 实验测试

实验主要分为两项:功能性实验与性能实验。其中,功能性实验主要测试平台是否能够有效实现所设计的各项功能,包括心理数据增删改查、心理问题预警等;而性能实验则负责检查系统能否在高并发的情况下实时、准确地完成各项数据处理请求。

1)功能性实验

该项实验又可具体划分为基本项实验与心理问题预警实验两部分。基本项实验可验证平台的基础功能是否满足要求,其为进行其他实验的基础。该项实验的结果如表2 所示。

表2 基本项实验结果

由该结果可以看出,平台能够顺利完成各项基础测试,从而保证后续实验的正常进行。

而心理问题预警实验主要验证所提算法在处理心理问题上的准确性,其可体现该算法的优势。为此,文中设置了基于决策树(Decision Tree)的心理问题预警算法(A 算法)和人工处理(B 算法)作为对照组和基准组进行实验,并分别评估学生的心理健康情况。此外,为了降低人工处理中所存在的主观性,对同一数据分别请多位老师同时进行分析,并取其分析结果的平均值为基准结果。心理问题预警对照实验结果如表3 所示。

表3 心理问题预警对照实验结果

由表3 可看出,该文算法的精度明显高于基于决策树的心理问题预警算法,且总体能够达到93%以上,充分验证了该算法在学生心理问题预警中的优势。

2)性能实验

该项实验可验证平台在高并发条件下的稳定性。此次设置的实验条件是模拟平台在10 min 内接受500 次访问请求,同时进行心理数据的采集与处理等操作,以测试平台的平均响应时间、CPU 与内存占用情况等。具体实验结果如表4 所示。

表4 平台性能实验结果

由表4 可知,在高并发情况下基于该文算法搭建的平台能够较好地满足性能要求,说明平台运行的稳定性与承载力均较强。

4 结束语

该文介绍分析了BP 神经网络与数据挖掘技术,并在其基础上提出了一种情感分析与心理预警算法。该算法主要由数据存储层、数据处理层及界面展示层所组成,各层相互配合,共同完成对高校学生心理数据的处理与分析,实验结果充分说明了所设计算法的有效性与准确性。

猜你喜欢
数据挖掘神经元预警
《从光子到神经元》书评
探讨人工智能与数据挖掘发展趋势
法国发布高温预警 严阵以待备战“史上最热周”
跃动的神经元——波兰Brain Embassy联合办公
园林有害生物预警与可持续控制
基于并行计算的大数据挖掘在电网中的应用
机载预警雷达对IFF 的干扰分析
一种基于Hadoop的大数据挖掘云服务及应用
基于二次型单神经元PID的MPPT控制
毫米波导引头预定回路改进单神经元控制