毛俊华
(上海市中医医院信息处,上海 200071)
模糊聚类是采用模糊数学语言描述事物特征的数学处理方法,能够根据所研究对象本身的属性,构建多个不同的模糊矩阵,并以此为基础,确定数据信息参量之间的隶属度关系,从而实现对聚类处理条件的准确定义。从数学特性的角度来看,与信息参量相关的数据度量集合越客观,最终计算所得的聚类处理条件也就越准确[1-2]。简单来说,聚类就是将全部数据集都划分成簇或类的形式,并且需要尽可能缩小数据参量之间的误差值水平,也就是通常所说的最大相似性聚类处理原则。
智慧医院是包含人工智能技术在内的医疗服务平台,可根据诊疗意见的不同,对数据信息进行集中分类。随着平台应用时间的延长,诊疗意见信息的累积量也会不断增加,从而导致非同种数据信息难以有效区分的问题。为解决上述问题,传统拆分型整合系统通过计算医疗服务信息全局最优解的方式,对已生成的大数据参量进行按需存储,再按照分级应对的方式,实现多源异构数据的整合处理[3]。然而此系统并不能完全解决多源异构医疗数据散乱分布的问题,易导致诊疗意见参考性下降。
为避免上述情况的发生,设计基于模糊聚类的智慧医院多源异构数据整合系统,借助异构数据统筹元件与量化整合芯片,建立关键的模糊聚类矩阵,再根据模糊集合的标定结果,得到完整的数据整合结果。
智慧医院多源异构数据整合系统的硬件应用体系由多源型处理电路、异构数据统筹元件、量化整合芯片三部分组成,具体搭建方法如下。
多源型处理电路存在于智慧医院异构数据整合系统的输入正极与输出负极之间,可在R、C 两类电阻元件的作用下,控制D1、D2两个异构体结构两端的传输电压水平,从而使得整个系统内部的传输电流始终保持相对稳定的数值状态。R 级电阻的接入阻值水平相对较小,对智慧医院异构数据的整合能力也就相对较弱,仅能将大规模传输电子量划分成多个小型应用结构[4]。C 级电阻的接入阻值水平相对较大,对于智慧医院异构型数据的整合能力也较强,在整合系统内可有效驱动大规模传输电子量,并将未完全消耗的部分传输至系统数据库主机中,从而生成长期存储记忆。多源型处理电路示意图如图1 所示。
图1 多源型处理电路示意图
异构数据统筹元件可在模糊聚类算法的支持下,改变智慧医院数据的原始存储形式,并从中提取出大量有用信息,一部分用于生成整合运行指令,另一部分则可直接借助传输信道反馈至各级硬件执行结构中[5-6]。ISVCM 设备作为异构数据统筹元件的核心应用设备,在单一作用时间内,能够记录智慧医院多源异构数据的实际存在形式,并可剔除其中边缘界线不完整的信息参量,将其暂时存储于系统数据库主机中[7-8]。由于模糊聚类算法的存在,异构数据统筹元件的作用能力相对有限,因此系统主机在执行过程中,并不会出现较为明显的过量输入或输出状态。异构数据统筹元件结构图如图2 所示。
图2 异构数据统筹元件结构图
量化整合芯片由ARM、PCM、FCM、HCM、管控开关5 类结构共同组成。其中,ARM 负责与异构数据统筹元件等上级硬件结构体相连,可准确掌握系统主机所记录的智慧医院多源异构数据传输情况。PCM、FCM 具备同等的执行优先级能力,能够按照模糊聚类算法的应用需求,对智慧医院多源异构数据的传输路径进行重新规划,一方面安排系统数据库主机中的信息传输行为,另一方面对已生成整合指令的作用价值进行验证[9-10]。HCM 受到管控开关的直接作用,当开关处于闭合状态时,HCM 可立即进入连接状态,并对智慧医院多源异构数据进行二次整合处理;当开关处于断开状态下,HCM 可立即进入非响应状态,并可将暂存的智慧医院多源异构数据快速反馈回系统运行环境中。量化整合芯片结构图如图3 所示。
图3 量化整合芯片结构图
在各级硬件执行结构的支持下,按照模糊集合标定、模糊聚类矩阵计算、数据整合函数的处理流程,实现系统的软件执行环境搭建,结合硬件与软件,完成基于模糊聚类的智慧医院多源异构数据整合系统设计。
模糊集合是一个相对笼统的数据边界限制条件,在智慧医院多源异构整合系统中,受到聚类思想的影响,模糊集合可将所有数据信息参量收录在内,且随着系统运行时间的延长,集合结构所收录的数据信息总量也会逐渐增大,直至能够完全包含各类医疗数据信息[11-12]。从宏观角度来看,模糊集合存在的意义与系统数据库主机类似,都具备较强的信息存储能力,但前者更注重对医疗数据信息的整合与加工,在执行存储指令的同时,可提取现有信息中的必要处理条件,并以此为基础,完善模糊聚类算法的实际应用能力。设wmin代表最小多源异构数据限制系数,wmax代表最大多源异构数据限制系数,联立上述物理量,可将模糊集合标定结果表示为:
其中,U1、U2代表两个不同的异构电压数值,I1、I2代表两个不同的异构电流数值,代表连接电阻均值。
模糊聚类矩阵描述了智慧医院多源异构数据在系统中的传输与应用能力,在已知模糊集合标定结果的情况下,模糊聚类矩阵可为系统主机提供准确的信息判别条件,而当系统数据库主机达到额定上限存储条件后,即可认为模糊聚类矩阵也随之进入最大数值饱和状态。在模糊聚类矩阵中,智慧医院多源异构数据具备横向、纵向两种存在形式,其中横向数值描述整合指令执行时的传输电流情况,而纵向数值描述了整合指令执行时的传输电压情况[13-14]。一般情况下,随着智慧医院多源异构数据量的增大,传输电流与传输电压的数值水平也会不断增大。设i代表电流分值系数,u代表电压分值系数,n代表极大值系数指标。模糊聚类矩阵表达式为:
数据整合函数是以模糊聚类矩阵为基础建立的智慧医院多源异构数据查询限定条件。在整合系统中,由于模糊聚类算法的应用能力较强,随着信息传输量的增加,整合函数极限值的覆盖面积也会不断扩张,直至能够完全满足多源异构数据的实际传输需求[15-16]。在模糊聚类算法的作用空间内,设xmin代表最小的智慧医院数据多源异构参量,xmax代表最大的智慧医院数据多源异构参量,若将信息参量的混乱传输行为考虑在内,则可认为上述两项物理指标的差值水平越大,最终所定义的数据整合函数也就越完整。在上述物理量的支持下,联立式(2),可将数据整合函数条件表示为:
其中,s、a分别代表两个不同的多源异构数据整合查找条件,在系统作用空间内,不等式a>s恒成立。kχ代表整合系数为χ时的智慧医院数据参量异构系数,kα代表整合系数为α时的智慧医院数据参量异构系数。
在图4 所示的智慧医院网络中,将该文系统与传统系统进行验证。在相同的实验环境下,通过不同实验指标来验证所设计系统的性能。
图4 网络环境
STB 系数可以描述多源异构医疗数据的分布散乱水平,STB 的值越大,数据分布散乱的水平越高。两种系统的STB 系数对比结果如表1 所示。
表1 STB系数值
表1 所记录该文系统的STB 指标在连续上升状态后,开始逐渐趋于相对稳定的数值状态。而传统系统的STB 指标数值呈现出先上升后略微下降的趋势。该文系统与传统系统的STB 系数最大值分别为34.44%与67.15%,说明该文系统的性能优于传统系统。
表2 记录了两种系统的多源异构医疗数据实际生成速率。
分析表2 可知,该次实验以15 min 为一个单位时长,该文系统的医疗数据生成速率在整个实验过程中,始终保持不断上升的数值变化状态。传统系统的医疗数据生成速率在第一个单位时长中,始终保持绝对稳定的数值存在状态,而从第二个单位时长开始,其数值水平则开始不断上升,到第四个单位时长,则又开始呈现相对稳定的数值存在状态,整个实验过程中,该文系统的最大值7.4 Mb/s 与传统系统的最大值2.6 Mb/s 相比,上升了4.8 Mb/s。
表2 医疗数据生成速率
上述实验研究结果表明,随着基于模糊聚类的智慧医院多源异构数据整合系统的应用,STB 指标系数水平得到有效控制,而医疗数据生成速率却开始不断上升,不但使得医疗体系内非同种的数据信息得到有效区分,也为诊疗意见的生成提供了可参考条件。
与拆分型整合系统相比,智慧医院多源异构数据整合系统在模糊聚类算法的作用下,借助多源型处理电路,连接异构数据统筹元件与量化整合芯片,再通过模糊集合标定的方式,建立标准的数据整合函数。实验结果表明,随着多源异构医疗数据分布散乱水平的下降,多源异构医疗数据的实际生成速率开始不断加快,不仅为医疗诊断意见的生成提供了可参考条件,也实现了对医疗体系内非同种数据信息的有效区分。