因素空间的理论研究

2019-08-13 08:47尹安琪关世杰
科技资讯 2019年16期
关键词:属性因素

尹安琪 关世杰

摘  要:随着因素空间理论的诞生和不断完善,其为知识表示和人工智能的发展奠定了基础并且得到了广泛的应用。该文针对因素空间进行了因素空间的展开与收拢和优化因素两个方面的研究,其中因素空间的展开与收拢主要体现了因素空间、因素和属性之间的层次性关系,根据决策树算法和聚类算法对因素之间的关系进行优化,凸显出重要的因素,可以对高维数据降维节省存储空间和判别的时间。

关键词:因素空间  因素  属性

中图分类号:TP311                                 文献标识码:A                         文章编号:1672-3791(2019)06(a)-0237-02

因素空间是汪培庄教授提出的以智能描述为主题的数学理论,曾在知识表示和人工智能领域发挥过重要作用,近年来,又以数据科学为重点,为大数据处理提供坚实的数学基础[1]。因素将事物抽象到同一个维度上,将分析的维度命名为因素,也是分析事物的角度。将因素的取值命名为属性,属性是对事物分类结果的内涵描述。当对一个事物进行描述时,该事物就被描述为一个点,描述该事物时可以从多个角度进行分析,将每个维度的因素进行交叉综合后,形成了事物描述的一种普适性坐标架,即因素空间[2]。因素空间的理论不仅是应用因素,还应挑选因素。在分析事物过程中,在众多因素中把真正起作用的因素凸显出来,因此需要对因素空间中的因素进行筛选,筛选后可以将高维度的数据进行降维。该文对因素空间的展开与收拢和因素之间的关系进行了研究和说明。

1  因素空间的展开与收拢的研究

因素空间与因素之间的关系,因素与属性之间的关系具有递进的层次关系。它们之间的关系与WordNet中的名词网络的中的上位关系、下位关系和同位关系以及整体部分关系相类似。以WordNet中椅子(chair)为例,其下位词包含的是扶手椅、理发椅、折叠椅、平板扶手椅等,这些是椅子的种类,就椅子的功能而言,扶手椅继承了椅子的功能,即下位词继承了上位词的属性,而下位词相比于上位词更加具体。在整体与部分的关系中,靠背和椅子腿是组成椅子的部分,即椅子包含靠背和椅子腿,它们之间是相互包含的关系。但是整体与部分关系改变了原有的事物本身,而在上下位的关系中所表示的仍然是同一事物,事物本身并没有发生改變。

WordNet中上下位关系与整体部分关系是等级关系,可以理解为因素空间的展开与收拢的方式。将因素空间中所有因素进行罗列,即对因素空间进行了展开,每个因素逐层向下级进行展开后,最终可以得到属性。如图1所示,因素空间展开后类似于树状结构,与中心点距离相同的是同一等级的因素。反向进行,将因素聚拢得到因素空间。在实际应用中,将因素空间进行展开后,事物的分析结果会更加具体,将因素空间进行收拢后,事物的分析结果更加具有概括性。因此,因素的思考维度有多少之分,考虑的维度越少,区分事物的难度变大,考虑的维度越多,事物能够彼此分离,区分的难度越小。

2  因素空间的优化研究

在机器学习、深度学习领域已经出现了粗糙集的属性约简,这为在因素空间中筛选因素提供了参考。在分析一个事物时,可以从多个维度进行思考,这些维度即因素。但是面面俱到的考量会浪费时间和存储空间,因此需要对因素进行筛选,选择重要的几个因素,这样在比较区分两个事物时会节省时间,并且降低的数据的维度,节省的存储的空间。本章节将从决策树算法和聚类算法两个方面研究因素与因素之间的关系,对因素进行筛选,完成对数据的降维。

2.1 决策树算法在因素空间中的应用

决策树算法是基于树状结构进行决策判断的,这种判断机制与人类进行决策的机制相类似。决策树算法的重点在于怎样选择数据集中起决定性作用的属性,并且随着不断进行的划分过程,尽可能地将相同类型的数据划分在一个数据子集内,即决策树结点的“纯度”越高。

在因素空间中可以运用决策树算法挑选出最优的因素,使用决定度大的因素对事物进行划分,从而化简了多维因素,能够快速地对事物进行分类决策。在应用决策树算法时需要考虑因素之间具有相互关联性,因此筛选出的几个最优的划分因素之间的冗余度要小,这样才能达到化简因素空间的目的。

2.2 聚类算法在因素空间中的应用

聚类算法通过计算样本数据之间的距离,经过比较距离后将样本划分成多个不相交的子集,每个子集是一个“簇”,并且使簇中的数据的距离尽可能的小(即同一簇数据之间相似度较高),不同簇之间的数据的距离尽可能的远。可以根据这一原理对因素空间中的因素进行聚类,再应用聚类后的结果对事物进行划分,从而缩短了比较的时间。

首先将因素空间中每个因素看作一个簇,计算簇与簇之间的距离,比较距离值并将距离较近的两个簇划分到一起,构成新的簇。以此类推,可以将因素空间中的因素划分为几个簇,再进行比较,这样就节省了判断的时间。

3  结语

该文对因素空间的展开与收拢和根据因素之间的关系对因素进行优化两个方面分别进行了阐述说明。在区分不同事物时可以根据因素空间逐级进行比较,同时可以对因素进行筛选,选择重要的因素,这样节省了比较的时间和存储空间,为今后因素空间理论的完善和数据处理奠定了基础。

参考文献

[1] 曲国华,李春华,张强.因素空间中属性约简的区分函数[J].智能系统学报,2017,12(6):889-893.

[2] 汪培庄.因素空间与因素库[J].辽宁工程技术大学学报:自然科学版,2014,32(10):1-8.

[3] 魏浩,丁要军.一种基于属性相关的C4.5决策树改进算法[J].中北大学学报:自然科学版,2014,35(4):402-406.

猜你喜欢
属性因素
英语教学中的文化因素
关于我国国内生产总值影响因素的计量分析
关于我国国内生产总值影响因素的计量分析
互联网时代的生成性教学属性分析与实践研究
对两种实体观的探析
用好文件“属性” 解决实际问题
Winsock控件的属性及应用方法