多属性决策模型在网络大数据挖掘中的应用

2022-12-28 11:20李雪梅马文辉张春庆王秀清
中国新技术新产品 2022年19期
关键词:医护分值数据挖掘

李雪梅 马文辉 张春庆 王秀清

(齐齐哈尔医学院,黑龙江 齐齐哈尔 161006)

随着计算机网络技术的深入发展,人们的日常生活和工作模式更多地依赖于互联网,这也导致了网络数据总量的爆炸式增长。网络大数据时代在给人们带来便利的同时也带来了新的问题——如何从海量数据中找到真正适合自己的信息,这就需要使用大数据挖掘技术[1]。多属性决策模型通过多个属性同时具有的判定增加决策的准确性和可靠性,是一种十分有效的决策方法[2]。在大数据挖掘过程中,仅利用单一属性的搜索必然会导致更多候选结果的推荐,使用户仍然无法做出合理的判断[3]。因此,多个属性的同时介入会大大增加网络大数据挖掘的有效性。据此,该文提出了一种多属性决策模型,并将其应用于网络大数据挖掘的工作中。

1 多属性决策模型及其数学原理

大多数问题的关联要素不止一个,对决策者要做出的处理,应该从多个渠道进行分析才更合理。决策者的每个分析渠道都对应了一个要素,也是决策者形成最终决策的一个指标,这些指标共同构成了生成决策的指标集合,如公式(1)所示。

式中:E为指标集合;e为评价指标;|E|为全部评价指标的个数。

根据每指标,决策者都可以从单指标的角度制定一个解决问题的方案,这样对应于指标集合可以形成一个解决问题的方案集合,如公式(2)所示。

式中:P为解决问题的方案集合;p为解决问题的方案;|P|为全部解决方案的个数。

在建立了指标集合和方案集合之后,可以进一步建立一个基于指标和方案的决策生成判断矩阵,如公式(3)所示。

式中:R为决策生成判断矩阵;r为决策生成判断矩阵中的元素。

决策在实际中的形成往往是集体成员多人商讨的妥协结果。不同的集体成员,其受教育程度、知识层次、社会经验阅历和价值观等都存在一定差异,他们寻求解决问题的视角也会明显不同。为了体现这种差异,可以给每个方案配置一个权重,以体现不同集体成员对不同方案的认可程度。这里,用参数qj表示第i个方案的权重,所有方案的权重满足下面的关系,如公式(4)所示。

还需要考虑的问题是,同一个决策所涉及的指标,其量纲单位、数值大小都存在明显差异,如果不加处理纳入最终的决策模型,会导致不同指标间的公平程度被破坏。为此,需要对各个指标进行归一化处理,正向指标的归一化如公式(5)所示。

负向指标的归一化,如公式(6)所示。

根据上面的理论,可知多属性决策的建模和决策过程如下。

术后当日患者卧床休息,术后第2 d即可佩戴腰围下地行走,并进行直腿抬高练习,防止神经根粘连,嘱患者术后3周内可适当进行腰背肌的功能锻炼,3个月内避免过伸、过屈、扭转等剧烈运动,避免搬提重物。

第一个环节:根据要解决的实际问题,建立各个指标和各个解决方案,并形成集合E和P;第二个环节:根据第一个环节形成的集合E和P,按照公式(3)建立决策判断矩阵R;第三个环节:给每个指标配置一个权重,得到权重集合Q;第四个环节:对方案集合、决策判断矩阵中的元素进行归一化,操作如第五个环节:根据T(pi)的值进行排序操作,根据排序结果判定何种方案是解决问题的最终方案。

2 网络医药设备数据挖掘及多属性设计

为了验证多属性决策模型在网络大数据挖掘中的有效性,先来构造该文的数据挖掘对象——网络医药设备销售数据挖掘。

对医院和有消费能力的个人用户而言,医药设备的购置是比较普遍的问题。医药设备具体可以分为医疗设备和制药设备,根据不同的功能和型号又有非常细致的划分。消费者在购买医药设备时,互联网是目前重要的销售平台。但网络上同一类医药设备的相关信息数据量大、种类繁多,给消费者的合理选择带来了困难。为此,对医药设备进行多个属性的划分,进而运用多属性决策的方法完成筛选,可以有效解决消费者所面临的困扰。

该文从核心功能属性、外围功能属性、特色功能属性、随赠属性、包装属性以及综合属性等6个方面,给出了医药设备销售信息的多属性特征集合,见表1。

从表1可以看出,核心功能属性、外围功能属性、特色功能属性、随赠属性、包装属性和综合属性6个属性下,又分别配置了6个子属性。对这些子属性的评价,即可形成对医药设备是否符合消费者购买需求的一个判定。对具体的评价等级设置,该文中设定为非常好、很好、好、一般、不好、很不好6个等级,具体见表2。

3 网络医药设备数据挖掘结果及分析

表1和表2中,按照多属性决策理论的建模过程分别建立了医药设备销售数据的属性集合和方案集合。据此,进一步进行相关数据的挖掘试验,通过挖掘结果判断该文提出的多属性决策挖掘方法对大数据挖掘的有效性。

表1 医药设备销售的多属性特征集合

表2 医药设备的多属性评价方案

为了能够明确网络销售数据的检索,该文以医护用床为具体的医药设备名称在网络上进行检索,得到相关信息后对购买客户进行调查,并收集评价数据。最终,选择医护用床排名前3位的AAA品牌、BBB品牌和CCC品牌,作为进一步调查的品牌数据。因为原始数据的信息量较大,无法在文中做全部展示,此处以综合属性C6的功能子属性为例,共统计100条调查结果:表示非常好的人数为15人,表示很好的人数为24人,表示好的人数为31人,表一一般的人数为16,表示不好的人数为12,表示很不好的人数为2。据此,可以得到功能子属性的评分为70.8分。

按照同样的方法,逐一对每个品牌医护用创进行多属性决策评判。

首先,观察AAA品牌医护用床的多属性决策图阵,如图1所示。

从图1可以看出,消费者对AAA品牌医护用床的外围功能属性一致看好,对其核心功能属性、随赠属性评价也比较高,这和AAA品牌医护用床长期致力于外围功能属性提升的实际情况相一致。

从图1还可以得出,AAA品牌医护用床的核心功能属性平均分值为68.9,外围功能属性平均分值为81.2,特色功能属性平均分值为67.8,随赠属性平均分值为69.6,包装属性平均分值为66.3,综合属性平均分值为67.3。

图1 AAA品牌医护用床的多属性决策图阵

其次,观察BBB品牌医护用床的多属性决策图阵,如图2所示。

从图2可以看出,消费者对BBB品牌医护用床的核心功能属性、特色功能属性明显高于AAA品牌,但外围功能属性则低于AAA品牌。

从图2还可以得出,BBB品牌医护用床的核心功能属性平均分值为72.1,外围功能属性平均分值为75.5,特色功能属性平均分值为72.0,随赠属性平均分值为68.4,包装属性平均分值为67.1,综合属性平均分值为67.2。

图2 BBB品牌医护用床的多属性决策图阵

再次,观察CCC品牌医护用床的多属性决策图阵,如图3所示。

图3 CCC品牌医护用床的多属性决策图阵

从图3可以看出,消费者对BBB品牌医护用床的核心功能属性、外围功能属性明显低于AAA和BBB品牌,但随赠属性、包装属性则高于AAA和BBB品牌。

从图3还可以得出,BBB品牌医护用床的核心功能属性平均分值为62.0,外围功能属性平均分值为67.3,特色功能属性平均分值为67.3,随赠属性平均分值为70.8,包装属性平均分值为67.6,综合属性平均分值为65.8。

进一步,将3个品牌医护用床的属性进行对比,绘制成柱状图,如图4所示。

图4 3个品牌医护用床的属性对比

4 结论

为了解决网络大数据挖掘问题,该文提出了一种多属性决策的网络大数据挖掘方法。多属性决策数据挖掘方法先要建立指标、方案集合,并由此建立基于指标和方案的矩阵,再结合各方案的权重、归一化,形成各候选方案排序以供选择。针对3种品牌的医护用床网络销售数据为研究对象,执行多属性决策选择判断,结果显示:AAA品牌医护用床在外围功能属性方面更优,BBB品牌医护用床具有综合属性优势,CCC品牌医护用床也有自己的优势,不同用户可以根据自己的需求在3类品牌中进行选择。

猜你喜欢
医护分值数据挖掘
一起来看看交通违法记分分值有什么变化
工银医护无界卡一份对医护者的关怀
按病种(病组)分值结算:现状、做法和评价
基于并行计算的大数据挖掘在电网中的应用
“医护到家”真能“到家”?
老年习惯性便秘的蒙医护理
中老年高血压病的预防及蒙医护理
一种基于Hadoop的大数据挖掘云服务及应用
宿迁城镇居民医保按病种分值结算初探
基于GPGPU的离散数据挖掘研究