基于多层感知器神经网络的智能分类算法

2020-04-21 10:35李心宇李晓航李志伟李冬雪
通信电源技术 2020年5期
关键词:降维结构化神经网络

李心宇,李晓航,李志伟,李冬雪

(1.吉林大学 软件学院软件工程系,吉林 长春 130000;2. 吉林大学 数学学院,吉林 长春 130000)

1 多层感知器神经网络拓扑结构

1.1 四层作业架构

多层感知器神经网络,重视以较多的层次进行复杂信息快速处理,拟构建四层作业架构,拓扑结构见图1。

图1 多层感知器神经网络拓扑结构

对该结构进行分析可发现,其特点在于增设了两个中间层次,基层仍负责海量信息的直接收集和处理,之后反馈给中层,再由中层反馈给高层。此过程中所有信息不断得到优化和加工,有助于实现高效率的分析和决策。

1.2 不同层次功能

基层的功能在于直接进行海量信息的直接收集,并对其进行初步加强,使完全松散的数据信息带有一定的半结构化特点。在此基础上,半结构化信息被传输至中层,由中层将其加工为结构化信息,并借助中层的另一个层次进行处理,使其在结构化的基础上完成分类,再选取合适的信道进行传输。结构化的分类信息最终传输给高层,即多层感知器神经网络的终端,结合传输结果进行信息分析和最终决策。

2 智能分类算法设计

2.1 降维设计思路

多层感知器神经网络对信息处理的要求极高,不同信息富含的内容也较为多样,具有多个可分析的维度。例如,信息内容为“X 省XX 大学X 学院100 名学生考入清华大学研究生院”。该信息中可分析的维度包括地理信息、学校信息、动态信息、主体信息等。如果各类信息均完整进行所有维度评估,工作量较大,难以保证效率,不符合多层感知器神经网络的工作要求,也无法发挥智能分类算法的积极作用。拟采用降维设计思路,在多层感知器神经网络的各层次,只在层次内对信息的核心维度进行提炼,以完成海量信息的快速处理[1]。

2.2 基层K 近邻算法

多层感知器神经网络的基层即第一层,作用与人体各处的神经元类似,强调海量信息的收集和快速加工。以降维训练法为基础,拟在该层次收集K 近邻算法进行工作。选取工作对象后,提炼其核心维度信息,将提炼后获取的信息作为标准K 点带入计算机中实现记忆。收集所获的信息越多,K 点的选取越具科学性。例如,工作对象为“大学生消费信息统计”。可选取的核心维度包括大学生和消费额两个方面。多层感知器神经网络内广泛分布的基层神经组织,可对各类信息进行初步收集,信息被收集后均投入到K 近邻算法的定义域内。如果该信息与两个标准K 点学生、消费额均较为接近,表明其符合信息收集要求,可对其进行下一步处理。如果基层资源丰富,可做性别、年龄等维度的设计,进一步发挥基层的计算价值,提升信息加工的有效性。如果基层计算资源相对缺乏,则不做更多信息,以核心维度进行信息初筛和计算即可[2]。

2.3 其他层次随机森林法

第二层次、第三层次采用的智能算法均为随机森林法。基层完成原始信息的收集和初步加工后,以“学生、消费额”为核心维度的信息被传输至第二层。第二层仍借助降维方式进行计算,设定“性别”“地区”“年级”等核心维度,在此基础上调整训练方式,建立涵盖至少30 000 棵决策树的森林。所有样本投入第二层次后,均由森林内决策树进行分析。例如,A样本含有“性别”“地区”“年级”等维度信息,森林中3 000 棵树木认为信息包括“女性”特点,尝试将其纳入女大学生信息库。20 000 棵树木认为信息包括“男性”特点,尝试将其纳入男大学生信息库。根据多数原则,可认为A 样本中的目标为“男性”,进行对应信息的快速加工,进一步提升其结构化特点。

第二层次信息完成智能计算后,继续发送至第三等级。第三等级借助降维方式进行计算,以随机森林法进行智能分析,其设定的分析维度与第二层和基层均有不同,更强调借助具有高度特点的方式完成信息的筛选,如“学历”维度、“消费结构”维度、“消费等级维度”等。以消费等级维度为例,可设定高级(月消费超过3 000 元)、中级(月消费在1 500~2 999 元之间)和低级(月消费在1 499 元及以下)。在此模式下,第二层次传输的所有信息得到该层次的进一步加工处理,更具结构化特点。计算完成后可传输至第四层次,直接用于分析、查看。

3 模拟实验

3.1 模拟对象与指标

模拟对象为A 地区17 所大学的成绩情况,借助大学信息资料库建立基于多层感知器神经网络的智能分类算法模型,采用第一节、第二节所述的设计和算法进行模拟分析。以常规单层次感知器神经网络和传统算法对照,评估新方式的积极作用。观察指标为计算耗时、结果是否存在差错和信息完整性。其中,信息完整性包括原始信息完整性、半结构化信息完整性和结构行信息完整性3 个方面。三类信息均完整,可随时调取查看,评估为完整。样本数共18.52 万个,均为随机样本,不进行重组[3]。

3.2 模拟过程

模拟过程分为两个阶段。第一阶段为新方式阶段,直接将所有样本投入到第一层次进行大范围收集和分析。设定第一层次分析维度为“成绩”“年级”“学院”3个方面;第二层次分析维度为“不同科目”“必修课”“选修课”;第三层次为“优等”(得分超过80 分)、“中等”(得分60~79 分)、“较差”(得分59 分或以下)。第四层次直接进行第三层次信息的收集和查看。第二阶段为常规单层次感知器神经网络和传统算法模拟。对照标准为上述学院的现有信息。

3.3 结果与分析

实验结果见表1。

可见,基于多层感知器神经网络的智能分类算法,能够快速完成18.52 万个样本的分析和计算,耗时6.4 s,未出现差错,信息完整性为100.00%。对照组采用常规单层次感知器神经网络和传统算法进行工作,计算耗时为12.2 min,出现差错共411 例,且信息完整性为66.67%,仅实现了非结构化信息、结构化信息的保存,无法提供半结构信息,表明基于多层感知器神经网络的智能分类算法具有较高的价值。

表1 模拟实验结果

结合实验结果,四层次感知器神经网络存在结构相对复杂、对硬件设备要求高、对通信活动要求高的特点。不同层次之间的交互,要求以无线模式和优先模式并行的方法开展。当出现通信信道拥堵问题时,基层可能无法获取对应的原始信息,中层、高层之间的信息交互也会受到影响。此外,频繁的信息交互也可能导致互扰问题,导致信息可读性下降。此外,无论采用K 近邻算法或随机森林法,均面临大量数据收集和训练的问题,且需要合理进行筛选、计算维度的选取,以免出现计算遗漏或降维不当。

为予以应对,不同层次进行早期训练时可收集大数据信息,确保基于目标的算法具有高度适用性。例如,借助大数据进行消费信息评估时,应考虑收集所获信息与工作对象的相关性,剔除无关信息的同时,确保主要信息内容详实、丰富且客观。降维训练法下,在计算维度选取时,要求保证所选维度能与对象核心信息相匹配。建议在实际工作中加强信道建设,在条件允许的情况下,以有线信道提供通信服务,所有信道均避免接收干扰源头。从算法设计层面看,还应引入智能分析法。当存在信息传递和交互需求时,借助中层(包括第二层次和第三层次)进行信道拥堵程度的智能化评析,优先选取较流畅的信道进行信息传输。为避免信息出现互扰,可采用降噪技术,在信息的接收一端对初步收集和传递的信息进行筛选、加工,筛除各类噪音。

4 结 论

基于多层感知器神经网络的智能分类算法具有较高价值,也具有可行性。多层感知器神经网络拓扑结构为四层模式,不同层次功能各自独立,拟采用降维设计思路对海量数据的处理采用K 近邻算法,用于多层感知器神经网络基层,其余层次以随机森林法进行智能计算。模拟实验证明,上述理论具有可行性。

猜你喜欢
降维结构化神经网络
混动成为降维打击的实力 东风风神皓极
基于递归模糊神经网络的风电平滑控制策略
改进的非结构化对等网络动态搜索算法
深度学习的单元结构化教学实践与思考
Helicobacter pylori-induced inflammation masks the underlying presence of low-grade dysplasia on gastric lesions
结构化面试方法在研究生复试中的应用
左顾右盼 瞻前顾后 融会贯通——基于数学结构化的深度学习
降维打击
神经网络抑制无线通信干扰探究
基于神经网络的中小学生情感分析