基于定性数据定量化变换改进熵值法及其应用

2020-04-29 14:25:30詹棠森汪子婷汤可宗欧阳震坤

江西科学 2020年2期

詹棠森，汪子婷，汤可宗，欧阳震坤

(景德镇陶瓷大学信息工程学院，333403，江西，景德镇)

0 引言

关于艺术品的定价方法，很多是采用一种主观的定性方法。艺术品的价格存在混乱、以次充好、甚至是以赝代真等问题[1-2]。出现这种问题，最关键的就是没有用定量化的模型进行评价。现在，国内外艺术品的定价方法主要有以下5种方法：一是代表作方法，这种方法就是用代表其在市场上所有作品的代表作的平均价格作为艺术品价格指数。该方法的可取之处是直观而且简单，但不同的人就有不同的价格指数，即使用某一个场拍卖数据进行平均得到艺术品的价格指数，但还是无法评价不同其他艺术家和不同艺术风格的作品。对艺术品进行分类和选择代表作品时，存在着任意性。因此,该方法并不能作为定价的一般方法。二是双重出售法，最早由Baumol用标准连续复利回报率公式测量至少售出2次的绘画的回报率。不足之处是有很多作品没有再次出售，并且数据获取较难。三是重复销售法，通过对一段时间重复成交记录的所有绘画作品的价格进行回归估计，估计的系数就是艺术品价格指数的值。这种方法同样不适应单个作品的评价。四是特征价格指数法，为了克服双重和重复销售法中交易数据获取困难问题，最早由Court[3]提出特征价格指数法。特征价格法就是把特定商品的量分解成反映其特性的一系列指标，通过对成交数据取对数进行回归(hedonic回归法)。这样在回归方程里，回归系数不稳定与样本选择不同所带来的偏差是密切交织在一起的，这样降低了艺术品价格指数的可靠性。五是其他定价方法，Roberto Zanola利用数据包络方法，通过效率值分析拍卖行对艺术品价格的影响，但一种艺术品不是在同时进行拍卖的就很难分析拍卖行对拍卖价格的影响。文献[2]在随机抽样对成交价是否在估价范围之内，发现很多画家的作品价格被低估的概率大于被高估的概率。并且在定量化的过程中，很多虚拟变量都是用0和1进行表示的，这样在取对数过程中，对应指标都定义为0。可以说，这种不科学的定量方法在评价艺术品时，都是很片面的。如何把定性的因素进行定量，指标定量化及权重的确定具有举足轻重的地位。

指标权重确定的科学、合理，评估结果的可靠性与正确性就高。指标赋权方法分为主观赋权法和客观赋权法[4]。依据已拍卖的陶瓷艺术品客观价格数据信息可以定量影响陶瓷艺术相同因素的值。熵值法是常用的客观赋权法，该赋权方法意义明确且对决策方案数及指标个数没有限制，但当某个指标值与其他指标值离散程度较大时，该指标的熵值及权重会很大，导致该指标影响最终的评价结果。为了克服这种偏离太大的问题，文献[5-6]借鉴AHP赋权法，构造基于指标信息熵的判断矩阵[7-8]，从而得到各个指标的权重值。这种决策方法只是用熵值得到的权重再去评估各个决策单元的值，但这种排序结果是否准确，没有评判的标准。文献[9]首先根据灰色GM(1, 1)模型和线性模型的预测结果的相对误差作为影响因素，对相对误差序列进行变换，然后再按照传统熵值法计算各个预测值的权重，从而得到组合预测值，但这里首先要用其他方法进行预测，后再利用熵值法，如果没有其他的预测方法也就无法计算，并且计算比较复杂。对于陶瓷艺术如何从定性的数据进行定量并进行预测具有较好的研究意义，但现在都很少对这种内容进行研究。虽然，在文献[10]中通过小波神经网络算法对陶瓷艺术的价格进行预测，但这种方法在数值比较大的时候，由于小波函数的分解值几乎都等于0，这样在小波神经网络算法的迭代中，网络的调整值中基本等于0，这样就会造成误差很大，预测结果就不精确。另外，通过很多算法对这种定量化后的预测都会出现过拟合状态。出现这些现象，关键是各因素相同情况下，定量值是相同的。所以在选取样本时，尽可能选取不同因素样本进行分析。本文就是在相同因素情况下进行定量后，通过价格与影响因素的关系重新得到新的定量数据，把新的定量数据利用熵值法进行综合权重排序，并用这种改进熵值法进行预测，预测结果符合价格的范围，说明应用该方法的过程及改进效果。通过对比分析，提出的基于数据变换改进熵值法相对于熵值法及其他熵值法有一定的优势，确定指标权重的方法更加合理有效。

1 基于数据变换改进熵值法的基本原理

1.1 数据预处理

评价指标对象的定量值为x=(x1,x2,…,xn)T，而每个决策单元或方案包含了k个指标，记xi=(xi1,xi2…,xik)，i=1, 2,...,n。由于各指标之间的量纲不同，因此首先对各个指标数据进行无量纲化处理。当选取的指标数据是越大越好时，即选定的指标数据都为正向指标，这样的数据采取极差方法对数据进行如下无量纲化处理：

(1)

1.2 熵值法的基本步骤如下[9]

1)计算第个i决策单元下第j个指标占该指标的权重，即第j个指标下第i个决策单元Ai的贡献度pij可表示为

(2)

其中pij为第个j指标下第个i决策单元占该指标的权重。

2)计算第j个指标的熵值，即计算所有决策单元对属性Xj的贡献总量为aj

(3)

其中m=1/ln(n),(m>0,0≤pij≤1)，假设当pij=0时,pijln(pij)=0。

3)计算信息熵冗余度：

bj=1-aj，j=1,2,…,k

(4)

4)计算各项指标的权重值：

(5)

5)计算各决策单元的综合指数

(6)

2 基于数据变换改进熵值法及应用

由于在陶瓷艺术评价中，只知道每个陶瓷艺术品的价格，首先确定几个主要的定性指标(朝代、造型、装饰、尺寸(高，直径)、图案)，其次，对于5个定性指标如何定量化才比较客观，并能够反应价格的关系。首先，通过162个陶瓷艺术品的拍卖价格[11]，根据定性指标的属性相同情况下所对应的价格进行平均，所得到的平均值作为各指标的各个属性值。比如朝代中的唐五代，就是根据这个朝代的数据所对应的价格进行平均得到唐五代的属性值。这样所得到的属性值叫初步的指标属性定量数据。其中尺寸的分类属性是根据0～10、10.1～20、20.1～30、30.1～40、40.1～50、50以上6种属性分类进行定量化。下面选取了24个样本，其中22个样本作为仿真数据，另外2个样本作为预测数据。通过所选取的22个样本数据研究熵值法的适应性和排序的一致性，研究陶瓷艺术数据如何定量化的适应性。24个样本各个指标的定性数据和根据162个样本数据以各个指标的相同属性平均值得到的定量数据如表1，另外如果以24个样本(自身)数据的各个指标的相同属性平均值所得到的定量数据放在对应的下一行，如表1。

表1 24个陶瓷艺术品的以指标定性数据和定量数据(以162个样本和22个样本分别求平均值取整)

表1(续)

对每个指标的相同属性是为了得到各指标定量化的客观依据，根据上式(1)～式(6)熵值法步骤得到各个指标的权值pj,j=1,2,3,4,5，得到各决策单元的综合指数si,i=1,2,…,22，并根据综合指数进行排序与实际价格的排序之间的差别。具体的不同样本个数情况下5种指标权值如表2和排序结果比较如表3。

表2 162个样本和22个样本分别所求平均值对应的5种指标权重

表3 不同样本情况下22个样本的综合指标Si及排序和实际价格的排序(小到大)

从上面的排序结果可知，以22个样本数据求对应指标属性值进行熵值法所得到的排序与各样本价格排序只有4个是对应排序相同，以162个样本数据求对应指标属性值进行熵值法所得到的排序与各样本价格排序也只有4个是对应排序相同的，这样的排序结果是很差的。这种利用熵值法所计算的综合指数并不能反应陶瓷艺术价格的波动情况。为了修正这种熵值法，在式(1)和式(2)之间对数据进行变换，变换数据改进熵值法的步骤如下。

1)首先要对定量数据进行新的行变换，由于这些指标的属性量纲都是以价格为基础平均得到的数据，所以量纲是一致的。

(7)

2)变换后的数据乘以价格，得到新的定量数据

(8)

其中ci是每一个陶瓷艺术样本的价格。

只要通过这种与价格相关的定量数据变换，才能把不同样本相同因素的定量值进行改变，才能改变样本综合指标值，具体的变换值同表4。

3)利用式(1)～(6)熵值法的步骤求变换后的熵值及综合指数值，具体如下表5、表6。

表4 162个样本和22个样本分别变换后的定量数据

表5 162个样本和22个样本分别变换后对应的5种指标权重

表6 数据变换后不同样本情况下22个样本的综合指标Si及排序和实际价格的排序(小到大)

从表4、表5结果反应，通过对定量数据进行新的行变换后，乘以价格，得到新的定量数据。再按照修正的熵值法求各个样本的综合指数排序与其价格的排序完全相同。并且利用修正的熵值法所得到的5种指标权重对样本23、24的2个样本进行预测。得到不同总体样本情况下，综合指数值如表7。

表7 预测样本23、24的2个样本的综合指数值

表6中，当选取162个多样本数的平均值进行改进熵值法进行预测时，预测1号样本的价格2 585 000是介于6号样本价格2 156 863和12号样本价格2 750 000之间。所求预测1号的综合指数0.101 9也介于6号样本综合指数0.076 4和12号样本综合指数0.111 3之间。预测的2号样本的价格1 900 000是介于2号样本价格1 828 500和6号样本价格2 156 863之间，预测2号样本的综合指标值0.066 5也介于2号样本综合指数0.056 7和6号样本综合指数0.076 4之间。说明预测的2个样本的综合指数排序与价格的排序一致。若用22个少样本数的平均值进行改进熵值法进行预测时，所求预测1号样本的综合指数0.120 5介于6号样本综合指数0.092 5和12号样本综合指数0.125 7之间，说明预测样本的综合排序与其价格排序是相同的。但在预测2号样本的综合指数0.072 5不介于2号样本综合指数0.072 7和6号样本综合指数0.092 5之间。说明预测2号样本的定价有点偏高。

3 总结

传统的熵值法在不同样本作为参考样本集时，所得各个样本综合指标与价格排序都只有10%的一致性，具有较大的偏差；另外，通过改进熵值法，所得各样本的综合指数的排序结果与各样本的价格排序结果100%一致。对于预测样本，选取大样本数作为参考样本集比选取少样本作为参考集所得预测结果排序要精确。通过实例，说明本文所提出的改进熵值法具有较好的适应性和应用价值，并能反应陶瓷影响因素定量定价的合理性。