魏茗
关键词:序贯三支决策;多粒度结构;决策代价
1引言
三支决策是解决不确定性问题的粒计算方法,其主要思想是三分而治,即将整体分为3个部分并采取不同的决策行为处理这3个部分。与二支决策不同,三支决策在接受决策和拒绝决策外加入延迟决策。将研究对象划分到正域、负域和边界域中,对这三个域中的对象分别采取接受、拒绝、延迟决策。对于无法被划分至正域或负域的对象,将其划分至边界域采取延迟决策。延迟决策是为了进一步做出准确的决策,它需要依据更多、更有力的信息来进行下一步决策。姚一豫教授在粒计算理论基础研究上首次提出了序贯三支决策,构建了多层次的粒度结构,粒度层由低到高,粒度由粗到细。这种动态的决策思维方式能够很好地体现出人们在处理现实问题时所采取的循序渐进的科学的决策过程。例如,在医学诊断中,进行初步检查后由于信息不足无法判断病人的患病情况时,我们将其划分到边界域中,待引入新的检测方法后对患者逐步检查,最终诊断出患者病情并提供相应的治疗方案。序贯三支决策的多粒度结构适用于处理动态的、复杂的、不确定性的问题,如今广泛应用于人脸识别、情感分析、医疗诊断等领域。
2序贯三支决策模型理论基础
序贯三支决策采用多层次,多阶段的思想处理问题。对象认识的粒度由粗变细,逐渐做出准确的决策。在多粒度结构中的某一个粒度层,在序贯三支决策中,被划分至边界域的对象,由于支撑决策的证据不足,我们采取延迟决策,并把上一层的边界域作为下一层的处理对象,继续采用三支决策进行划分,这样在多个阶段的划分中边界域的对象被逐步划分到正域或负域。
杨新等在此基础上提出了更加广义的动态三支决策框架,对每一粒度层处理对象给出了7种不同的选择情况。具体定义如下:
3序贯三支决策模型的研究现状
目前,已有许多关于序贯三支决策理论方面的研究。在原有三支决策的研究成果基础上,Yao等从多粒度的角度出发,首次构造了序贯三支决策这种动态的三支决策模型,给出了序贯三支决策的具体算法,分析得出相较于二支决策而言,序贯三支决策方法可能具有更小的决策结果代价。基于此众多研究工作者针对序贯三支决策开展了大量的研究。传统的序贯三支决策将上一层的边界域作为下一层的处理对象,杨新等基于多选择处理对象、多粒度层次和多样化代价结构提出了一种广义的序贯三支决策方法,给出了每一个粒度层处理对象的7种选择情况,得到了一种更加广义的动态三支决策框架,适用范围更广。Yang等系统地研究了基于概率粗糙集的序贯三支决策框架,針对复杂问题的求解,提出了一种序贯三支决策多级增量模型,并计算了粒度转换和处理的决策过程代价,利用多级增量算法达到降低决策代价的目的。但Yang等未考虑属性冗余问题,为了消除属性冗余与属性不相关问题对总决策代价的影响,邢颖等首次在序贯三支决策模型研究中加入属性约简的步骤,以代价敏感的视角来实现序贯三支决策的改进。杨新等试图将基于数据和基于模型的两种粒度构造方法进行融合,形成具有时空特性的多层粒结构并实现序贯三支决策,用以平衡误分类代价与训练代价。Li等分析并研究了序贯三支决策的决策代价及其变化情况,从低粒度层到高粒度层,决策代价不断降低,研究出代价敏感的序贯三支决策方法。基于优化策略,方宇等利用不同层次的代价矩阵来构建代价函数,在粒度由粗变细的过程中,决策过程代价和决策结果代价不断变化,通过控制一种代价的上限,同时使另一种代价最小化,从而平衡总决策代价。
4序贯三支决策模型的应用
随着序贯三支决策理论的不断丰富,诸多学者将序贯三支决策应用于其他领域中,该理论已在文本情感分析、多分类和属性约简等方面得到了广泛应用,并取得了不错的进展。
为了克服文本情感分析的代价不平衡性的问题,范琴等把序贯三支决策的基本思想应用到文本情感分析中,基于文本数据粒化建立多粒度的序贯三支决策文本情感分析模型,强调误分类代价和学习代价。Li等用序贯三支决策解决神经网络中代价敏感面部识别问题,在人脸识别误差代价不均衡和缺乏高质量人脸图像信息的情况下,利用序贯j支决策模拟了人的决策逻辑,以寻求一种分类代价最小的决策。亓慧等将领域粗糙集、领域决策错误率与序贯三支决策相结合,构建出合理的属性子空间,定义了一种新的基于领域决策的序贯三支分类方法,借助领域决策错误率压缩属性空间,以此提高分类精度。在样本标记稀缺的情况下,陈洪研究了基于卷积神经网络的主动序贯三支决策模型代价敏感人脸识别问题,提出动态边界域思想,使得信息量增加的同时延迟决策代价也随之动态变化,大大提高了边界域划分的速度。传统的序贯三支决策不能有效处理连续值,针对这个问题,序贯三支决策中的代价参数缺少自适应性,基于此,庞国弘参考机器学习的思想,利用惩罚函数制定三支决策过程中代价参数变化的惩罚规则,决策阈值会随着代价参数的变化而呈现一系列有规律的变化,按照这种规律利用贝叶斯最小风险决策理论优化序贯三支分类模型。
5结论与展望
序贯三支决策是一种动态决策的典型方法,它很好地模拟了人类决策的逻辑,具有广阔的前景,但它仍面临部分无法回避的问题。目前的应用研究中,主要是将其他领域与传统序贯三支决策相结合,即把上一层的边界域作为下一层的研究对象,而对于另外6种情况的选择较少。阈值的选取是三支决策研究的重要内容,而序贯三支决策这种多粒度的结构,使得每一个粒度层的阈值都不相同,阈值选取更为复杂,文献给出了几种阈值确定方法但各有优劣,因此对于每一个粒度层阈值的选取和计算有待进一步研究。虽然,目前关于序贯三支决策模型决策代价的研究已经有许多,文献都对减小序贯决策代价做出了贡献。因此,对象的选择、阈值的确定以及决策代价的平衡等问题,有待进一步研究。