从偏好数据库中挖掘Ceteris Paribus偏好

2016-09-29 17:40辛冠琳刘惊雷

计算机应用 2016年8期

辛冠琳　刘惊雷

摘要：针对传统的推荐系统需要用户给出明确的偏好矩阵（U-I矩阵），进而使用自动化技术来获取用户偏好的问题，提出了一种从偏好数据库（preference database）中挖掘出Agent的偏好信息的方法。从知识发现的角度，通过Ceteris Paribus规则（CP规则），提出了k阶偏好挖掘算法（kPreM）。在算法中，利用k阶CP规则对偏好数据库中的信息进行剪枝处理，减少了数据库扫描次数，从而提高了偏好信息的挖掘效率。随后以一种通用的图模型——条件偏好网（CP-nets）为工具，揭示了用户的偏好可近似表达为CP-nets的定性条件偏好网。实验结果表明，用户的偏好都是带有条件的偏好。另外，通过挖掘得出的CP-nets偏好模型，为设计个性化的推荐系统提供了理论基础。

关键词：自动化技术；偏好数据库；知识发现；CP规则；定性条件偏好网

中图分类号：TP181

文献标志码：A

0引言

由于用户偏好信息在偏好数据库（preference database）中的必需性，增强数据库系统的偏好功能已经引起了许多专家学者的广泛关注。近年来，关于Ceteris Paribus[1]的偏好挖掘问题已经成为数据挖掘的研究热点[2-3]。从信息检索（information retrieval）[4]、推荐系统（recommendation system）[5]到个性化搜索引擎（personalized search engine）[6]等都能看到它的应用。偏好挖掘广泛存在于在线商业系统中，诸如音乐[7]、投票[8]和产品等均存在Ceteris Paribus偏好。对系统进行偏好挖掘的最基本的问题之一就是如何表示用户的偏好。其根源在于，用户的偏好不是一成不变的，随着外部条件的改变，用户的偏好也会随之改变[9]。在日常生活中，一个典型的实例就是在冬天，人们更偏好于穿棉衣；而在夏天，人们更偏好于穿单衣。这一情况说明季节的变化，影响了人们对于衣服种类的需求，这种偏好关系就是Ceteris Paribus偏好，其广泛存在于社会生活中[10]。我们在MovieLens数据集[11]中挖掘了用户的偏好信息，发现用户的偏好是有条件的。

但是在大多数的偏好数据库的挖掘学习中，并没有将Ceteris Paribus偏好考虑在内。Boutilier等[12]对偏好的建模和推理进行研究，为条件偏好网（Conditional Preference networks，CP-nets）模型提供了一个正式的语义，并对可利用的网络结构予以推理。Wilson[13]指出CP-nets的重要属性，如一致性的存在，最优配置可以有效地生成，并且可以很容易找到对应的全序关系；同时，为解决CP-nets的学习问题提出了一个约束优化方法。Pereira等[14]提出，对个性化的数据库应用，偏好查询语言有较高的说服力和表现力。以上文献均对偏好进行了一定的研究学习，但是对于用户在偏好数据库中的Ceteris Paribus偏好挖掘这一工作的侧重较少。

现有的条件偏好模型，如CP-nets[12，15-16]，增强的条件偏好网（Tradeoffs-enhanced Conditional Preference networks，TCP-nets），可分的其他条件不变的偏好网（Separable Ceteris Paribus preference，SCP-nets）等，尽管它们作为一种简单直观的图形表示工具，可以在其他条件不变的情况下，将用户的Ceteris Paribus偏好定性表示，但其仍然存在一些不足，主要表现在：空间复杂度较高和用户偏好挖掘问题的难解性。

在这种背景下，本文研究用户的Ceteris Paribus偏好挖掘问题。从偏好数据库中，观察统计用户偏好的依赖情况，提取偏好规则，以挖掘Ceteris Paribus偏好，并与真实的用户偏好模型进行比较。本文的主要工作如下：

1）在偏好数据库中挖掘Ceteris Paribus偏好的过程中，提出了k阶Ceteris Paribus规则（简称k阶CP规则）概念，并设计了挖掘k阶CP规则的算法。其中k表示偏好数据库中影响当前属性取值的父亲的个数。

2）通过在MovieLens偏好数据库上的实验，发现用户对电影的偏好是有条件的，即不同的电影属性取值确定了用户对该电影的评分高低。这一结果说明了现实中真实的偏好数据库常常是带有依赖属性的条件偏好。

3）借助于CP-nets图模型，发现了偏好数据库中的Ceteris Paribus偏好和CP-nets[17]具有一定的相似性，并设计了求偏好数据库和CP-nets相似度的公式。实验结果验证了CP-nets和真实偏好数据库具有一定的相似度，从而间接证明了偏好数据库可以用CP-nets来近似表达。

1相关工作

其他条件均同，某一条件的改变引起用户偏好的变化，我们将其称之为Ceteris Paribus偏好。对Ceteris Paribus偏好的挖掘，根据学习方法的不同，可以分为多种方法。从是否与对象内容有关的方面，Ceteris Paribus偏好的挖掘可以分为标签排序和对象排序；从挖掘偏好的方式上，挖掘用户偏好可以分为定量方法和定性方法。

1.1标签排序和对象排序

Ceteris Paribus偏好表达了对所有配置的一种偏序关系。挖掘Ceteris Paribus偏好实际上就是从偏好数据库中获取配置之间的序的过程，因此挖掘偏好就是一种学习排序（learning to rank）[18]的过程。学习排序可以分为标签排序和对象排序，本文的偏好挖掘属于对象排序。

标签排序是基于对象上的标签对对象所处的标签进行排序，以确定每个对象上的标签之间的序关系。对象排序是在两个给定的对象o1和o2中，基于对象的属性，预测o1与o2之间的偏好关系。对象排序最终确定的是对象之间的序关系，而不像标签排序那样，确定标签之间的序关系。因此，对象排序与内容有关。本文研究的偏好挖掘，和对象排序相关，它对偏好数据库中对象之间的序关系予以分析，探讨影响对象偏好的属性，从而实现对Ceteris Paribus偏好的挖掘。

1.2挖掘偏好的定量方法和定性方法

挖掘Ceteris Paribus偏好有两种形式，定量方法[19]和定性方法[20-21]。定量挖掘方法是对配置给定一个权值，配置之间的比较可转化为权值的比较；定性挖掘方法则无数值表示，仅给定偏序关系用以判定配置之间的偏好关系。挖掘Ceteris Paribus偏好是从偏好数据库中挖掘定性偏好的过程。

对于定性方法， Holland等[20]在帕累托偏好模型（Pareto preference model）下，提出了基于定性方法挖掘用户偏好的技术。作为一种新颖的偏好挖掘方法，其主要优点是通过语义表达偏好的挖掘结果。Jiang等[21]提出从偏好最优和最差的样本中挖掘用户偏好的方法，并利用贪心法证明其在真实数据集和合成数据集上都具有实用性。在偏好挖掘中，潜在的偏好模型仍是帕累托偏好模型。在该模型中，偏好是无条件的或是与上下文无关的，即一个属性的取值不依赖于其他属性的取值。

在定性方法中，与上下文有关的偏好模型（qualitative or contextual preference model）是本文的研究重点。Koriche等[22]提出了一种从用户提供的偏好中挖掘CP-nets模型的方法。de Amo等[23]提出了一个不同的方法ProfMiner，发现了由一组偏好规则规定的用户配置文件。该方法的特点是有高准确率和低召回率。次年，de Amo等[24]又提出了CPrefMiner算法，将用户的偏好信息表示成贝叶斯偏好网（Bayesian Preference Network，BPN）。而本文是从偏好数据库中提取k阶CP偏好，从而将用户的偏好信息表示成CP-nets。

2Ceteris Paribus偏好的相关概念和定义

2.1Ceteris Paribus偏好

Ceteris Paribus偏好是由Doyle等[25]提出的关于人类偏好的一个理论公式，它表示其他条件均相同的偏好（all-else-equal preferences）。Ceteris Paribus偏好关系[26]表达了在所有可能配置上的偏好信息。

定义1Ceteris Paribus偏好。若其他条件不变，单个属性的改变会影响对象之间的偏序关系。Ceteris Paribus偏好这一术语就是用来描述这一特性的，其形式化为式（1）所示，其中r是除φ和ψ之外的任意命题变量。

MovieLen 1M数据集在本质上就是一个偏好数据库。在MovieLens数据集中，用户对电影进行评分，分值为1～5。MovieLens包括两个不同大小的库，适用于不同规模的算法。在本文中，对MovieLens中大规模的库MovieLen 1M进行研究探索，挖掘其中的Ceteris Paribus偏好。通过对MovieLen 1M等偏好数据库的分析，我们试图解决如下问题：

1）在挖掘偏好数据库的Ceteris Paribus偏好信息的过程中，挖掘偏好数据库中的k阶CP规则，确定偏好数据库中影响当前属性取值的父亲的个数k。

2）确认偏好数据库中的用户偏好与基于G2检验学习得到的CP-nets[17]是否具有相似性。

为了挖掘偏好数据库中的Ceteris Paribus偏好信息，确定k阶CP规则，对偏好数据库中的属性进行了统计分析。若其满足k阶CP规则，表示其影响当前属性取值的父亲的个数为k。k的取值不同，则对应的Ceteris Paribus偏好也不相同，即偏好数据库中是带有依赖属性的条件偏好。

为了判断偏好数据库中的条件偏好是否具有依赖属性，在是否给定电影流派的条件下，在单个用户中对两个偏好次序进行比较。将MovieLen 1M偏好数据库中的电影信息分为两部分：一部分给定流派，另一部分未给定流派。根据用户对电影的评分，对在这两部分集合中的其他流派进行排序，作为流派不同条件下属性的偏好次序。若两个偏好次序不同，则认为偏好数据库中的条件偏好具有依赖属性。

偏好数据库中的Ceteris Paribus偏好与CP-nets的相似度可借助偏序关系来表示，其中，CP-nets可利用G2检验[17]的方式生成。偏序关系是指在偏好数据库挖掘信息过程中获得的偏好序列。可将通过挖掘得到的偏序关系与数据库中真实的偏序关系的比值，作为判断Ceteris Paribus偏好与CP-nets相似度的依据。

定义6相似度。N′和N分别表示挖掘得到的Ceteris Paribus偏好和真实偏好，其中：num（agree_edge）表示在两个偏好图中具有相同的起点、终点和相同方向的边的数目；num（total_edge）表示在偏好图中边的总数目。N′和N中的相似度可由similarity（N′， N）表示，且0≤similarity（N′，N）≤1。

式（3）可表示Ceteris Paribus偏好和真实偏好的相似度。真实偏好可基于G2检验学习方式获取其对应的CP-nets。similarity（N′， N）的值越大，表示在偏好数据库中挖掘得到的偏好信息愈加准确，与CP-nets也愈加相似。

2.3偏好挖掘实例

例2在MovieLen 1M偏好数据库中，任意选择一位用户，如userID=685的用户，他参与评价的电影数目为137，表1中给出了该用户对10部电影的评分。其中：Co表示Comedy（喜剧片），D表示Drama（剧情片），W表示Western（西部片），Ac表示Action（动作片），R表示Romance（爱情片），Ad表示Adventure（探险片），Ch表示Childrens（儿童片），An表示Animation（动画片），T表示Thriller（惊悚片）。若给定电影流派为喜剧片（Co），则将表1中的电影分为两部分，属于喜剧片的电影（Co=1）和不属于喜剧片的电影（Co=0）。

由表2可知，在Co=1和Co=0条件下，对应属性的偏好次序完全不同。因此可知，用户对电影的偏好是有条件的。为保证实验的随机性和准确性，表3和表4中列出了其他单个用户在是否给定条件下的偏好次序，结果也显示单个用户下偏好数据库是带有依赖属性的条件偏好。

步骤1确定偏好数据库中影响当前属性取值的父亲的个数k，k的取值为1到n-1，n是数据库中属性的个数。在V={X1，X2，…，Xn}中根据k的取值，选定一个集合U作为当前属性取值的父亲，UV。当k>1时，采用剪枝技术，根据k-1阶CP规则的结果Pruning（k-1）对所有可能的k阶CP规则进行剪枝。根据定理2，将k阶CP规则的子集中含有非k-1阶CP规则的属性集合舍弃，只对余下的可能的k阶CP规则进行处理。

步骤2根据当前属性取值的父亲U确定当前属性X，X是V-U中属性的子集。对U和X对应的偏好数据库中的属性进行选择投影，结果用t[U]和t[X]表示。在偏好数据库中，若t1[U]≠t2[U]和t1[X]≠t2[X]同时成立，则其满足k阶CP规则，因此，U是X的k阶偏好。否则，不满足k阶CP规则，因此，U不是X的k阶偏好。

步骤3将k阶CP规则下的偏好挖掘结果储存至Pruning（k）中，为k+1阶偏好的判断做准备。根据剪枝技术，可减少偏好数据库的扫描次数，建立有效的数据结构来提高检索效率，从而降低kPreM算法的时间复杂度。

3.2实例

以下通过例3来说明kPreM算法的处理过程。例3只有4个属性，数据库很小，但对于属性较多的偏好数据库，kPreM算法同样适用。

例3图2是一个关于k阶CP规则的实例。由图2可知，A、B、C、D是偏好数据库中的4个属性，表示偏好规则最多为3阶。现根据CP规则的生成顺序对其予以分析。

4算法的性质分析

4.1正确性分析

算法的正确性是衡量算法性能的重要指标。在本节中，通过定理3对kPreM算法的正确性进行验证。

定理3在偏好数据库中，满足k阶CP规则的属性U必是属性X的k阶偏好。

证明通过kPreM算法遍历偏好数据库，得到相关的Ceteris Paribus偏好信息和偏好数据库中影响当前属性取值的父亲的个数k。若公式u：x满足k阶CP规则，则U是X的父亲，即U是X的k阶偏好；反之，U不是X的父亲，可知属性X的偏好阶数未定或者属性X是无偏好的。

同时，不满足k阶CP规则的属性，其超集一定不满足k+1阶CP规则。因此，在k+1阶CP规则生成所有可能属性集时，可将子集中含有非k阶CP规则的属性集删去，以减少数据库的遍历次数，提高挖掘算法的效率。

4.2完备性分析

算法的完备性，表示偏好数据库中所蕴含的结论均可通过kPreM算法获取。在kPreM算法中，由于偏好数据库中影响当前属性取值的父亲的个数k的选取是从1到n-1，n是数据库中属性的个数，因此，算法的主要思想涵盖了在数据库的偏好挖掘中可能出现的所有情况。

定理4在偏好数据库中，根据k阶CP规则可得到所有偏好信息。

证明在扫描数据库的过程中，通过迭代技术，记录非k阶CP规则的属性，为k+1阶Ceteris Paribus偏好信息的挖掘作准备。若可能的k+1阶CP规则的子集中存在非k阶CP规则，则其也不是k+1阶CP规则。若其满足k阶CP规则，则对k阶CP规则的属性进行分析。由于k阶CP规则取值涵盖了偏好数据库中的所有属性，因此，可确定偏好数据库中的k阶Ceteris Paribus偏好。依照此步骤进行操作，遍历偏好数据库，挖掘全部的Ceteris Paribus偏好信息，就是算法完备性的表现。

4.3高效性分析

算法的高效性分析，可以体现在时间复杂度分析上。时间复杂度是指在偏好数据库中挖掘Ceteris Paribus偏好信息所花费的时间。在kPreM算法中，利用剪枝技术，在选取k+1阶偏好时，首先对所有可能的属性集进行验证，对k+1阶属性集中的子集不满足k阶CP规则的属性进行剪枝。因为如果当前属性不满足k阶CP规则，则其一定不满足k+1阶CP规则。由此，减少了对偏好数据库的扫描次数，提高了算法的效率，降低了算法的时间复杂度。

5实验与分析

5.1实验环境

本文中的算法挖掘实验在计算机上进行，操作系统是Windows 7 （64位），配有8GB DDR3内存和主频为3.2GHz的i5-4570 Intel CPU。程序编写语言是C语言，运行环境是Microsoft Visual Studio 2008。实验中对Ceteris Paribus偏好信息的挖掘在MovieLen 1M数据库中进行，挖掘过程中所需的数据均来自于MovieLen 1M数据库中的真实数据信息。

5.2实验过程

在偏好数据库中挖掘Ceteris Paribus偏好过程中，首先将偏好数据库中的数据信息转化成为计算机可以识别的形式。例如，将当前配置信息中具有的属性设置为1，不具有的属性设置为0，在实验中简化计算，提高运行效率；同时，也为后续进行详细的实验以测试偏好挖掘方法的正确性和延展性奠定了基础。

在偏好挖掘实验中，可根据kPreM算法中描述的步骤进行处理。输入为偏好数据库中的数据信息，经过kPreM算法的处理，输出对应的偏序关系。

5.3评估标准

为了验证通过挖掘得到的用户偏好与偏好数据库中的真实用户偏好的一致性，将挖掘得到的用户偏好N′与真实用户偏好N的一些要素进行比较，以相似度与一致度作为评估标准，衡量算法的性能。

5.3.1相似度

相似度是指通过算法挖掘得到的Ceteris Paribus偏好N′与偏好数据库的真实偏好N之间的相似度，即一致的边占所有边的比例。相似度越高，表明学习结果越精确，算法的性能越好。根据定义6中的式（3）可计算挖掘得到的Ceteris Paribus偏好和真实偏好的相似度。相似度计算公式similarity（N′， N）如下：

其中：分子表示在两个偏好图中具有相同的起点、终点和相同方向的边的数目；分母表示在偏好图中边的总数目。由于两个偏好图是基于相同的配置空间，因此，其对应的偏好图中的边的数目是相同的。

图3反映了在MovieLen 1M数据库中的685号用户在不同条件下学习所得到的偏好图与原偏好图之间的相似度的变化趋势，不同条件分别是指样本数目和显著性水平。显著性水平表示可能出现错误的概率，它不是一个固定不变的数字，可根据研究的性质和对结论准确性所持的要求而定。图3中：样本数目分别设置为20、50、100、200和500；显著性水平分别取值为0.05、0.10、0.15和0.20。如图3所示，样本数量越多，显著性水平越小，则对应的相似度程度越高；反之，则相似度程度越低。随着样本容量的增大，相似度趋于稳定。

5.3.2一致度

一致度是指通过算法挖掘得到的Ceteris Paribus偏好N′与偏好数据库的真实偏好N之间的一致度，即一致的样本占所有样本的比例。其中，偏好数据库的真实偏好N可根据G2检验学习得到。一致度越高，表明学习结果越精确，算法的性能越好。式（6）描述了一致度的计算公式：

其中：分子表示在两个偏好图中含有相同成对配置的数目，分母表示在偏好图中成对配置的总数目。由于两个偏好图是基于相同的配置空间，因此，其对应的偏好图中成对配置的数目是相同的。

图4中的一致度描述了MovieLen 1M数据库中的685号用户在不同条件下的一致的样本占整个样本的比例。由图4可知，样本数量越多，显著性水平越小，则对应的一致度越高；反之，则一致度越低。随着样本容量的增大，一致度趋于稳定。

5.4实验讨论

在实验过程中算法的性能必然会受一些因素的干扰，它们对实验结果产生了一定的影响。下面主要是对出现在实验中的一些影响实验结果的因素进行讨论，主要有：不同用户和样本数目。

5.4.1不同用户

在MovieLen 1M数据库中，不同的用户对相同的电影的评分是不同的，不同的用户偏好的电影类型也是不同的。在MovieLen 1M数据库中还随机选取了193号用户，对他的相似度和一致度进行计算，结果如图5、6所示。由图3～6可知，不同的用户尽管在样本和显著性水平的影响下的变化趋势相同，但是其对应的相似度和一致度仍有区别，具体体现在数值上，不同的用户对应的相似度和一致度的值是不一样的。因此，用户的不同是影响实验结果的主要因素。

5.4.2样本数目

用户的样本数目也是影响实验结果的主要因素。通常，样本数目越多，实验结果的准确性也随之提升。为确定用户的样本数目对实验的影响，实验中分别设置为20、50、100、200和500。实验结果可参照图3～6。由图可知，样本数目对实验有一定的影响。随着样本数目的增大，相似度和一致度虽有所变化，但均逐渐趋于稳定。然而，在实践中较大样本的设置并不能保证算法更好的性能。样本数目作为实验中的必需因素，对实验结果产生影响。

5.5实验对比

本文在偏好数据库中进行Ceteris Paribus偏好挖掘是在真实数据集MovieLen 1M上进行的。与之前学习CP-nets[17]中运用的随机生成的数据集相比，本次实验更具有说服力和真实性。在基于G2检验的CP-nets学习中，对相关偏好的挖掘是通过模拟数据进行的。即利用随机生成的数据生成成对比较的配置，通过G2检验的方式，判断每个属性的依赖关系。尽管使用随机生成的数据具有简单、高效和避免干扰等优点，但是其数据的模拟性不可避免，随机产生的数据与当前配置之间的关系无法判断。在本文中，采用MovieLen真实数据集，一方面引用真实数据，使实验的真实性和正确性具有理论依据；另一方面，真实数据的引入使挖掘用户偏好具有实际意义。

与Dimopoulos等[10]提取Ceteris Paribus偏好工作相比，本文中的实验对各种情况的考量更为全面。因为Dimopoulos等[10]提出的Ceteris Paribus偏好提取方法不能处理噪声数据，也就是说在通过被动学习方式挖掘Ceteris Paribus偏好的过程中，若根据观测用户得到了错误的信息，则依据该方法不能挖掘得到Ceteris Paribus偏好信息。而在本文提出的挖掘偏好方法中，考虑到了噪声数据的存在，保证了即使在噪声数据的影响下，依然可以通过学习挖掘得到Ceteris Paribus偏好。

6结语

本文通过无关性检验的方式实现在偏好数据库中的Ceteris Paribus偏好挖掘。通过设计偏好挖掘算法，探索在偏好数据库中关于用户的偏好信息以及其影响因素，表明在偏好数据库中的所有用户的偏好均是有条件的；深入挖掘用户偏好信息，发现用户的偏好不仅是有条件的，并且满足Ceteris Paribus偏好；将挖掘所得到的Ceteris Paribus偏好与CP-nets进行比较，并计算其相似度，分析挖掘学习的性能。但是，本文仅在MovieLens数据集上进行实验比较，尚未在其他实验数据集，如Netflix上进行。对用户偏好信息的挖掘只限于单个用户，没有考虑群体用户的情况。

本文所设计的算法为如下工作提供了基础：1）偏好数据库中，挖掘用户满足的偏好规则特性，如用户偏好是否满足传递性。2）根据k阶CP规则，探索影响Ceteris Paribus偏好阶数k的因素，进一步挖掘偏好数据库中的偏好信息；同时，将多个用户的偏好聚合成群体用户的偏好。3）尽管当前算法利用剪枝技术实现了偏好数据库中Ceteris Paribus偏好的挖掘任务，但是其时间复杂度仍然较高。因此，是否能够利用近似挖掘算法来降低时间复杂度可以作为进一步的工作。4）解挖掘得到的用户偏好与基于G2检验学习得到CP-nets图结构上的汉明距离，从而说明挖掘算法所得到偏好规则的质量。

参考文献：

[1]GROSSI D， LORINI E， SCHWARZENTRUBER F. The ceteris paribus structure of logics of game forms [J]. Journal of Artificial Intelligence Research， 2015， 53（1）： 91-126.

[2]LIU W， WU C， FENG B， et al. Conditional preference in recommender systems [J]. Expert Systems with Applications， 2015， 42（2）： 774-788.

[3]陈勐，禹晓辉，刘洋.基于深度表示模型的移动模式挖掘[J].计算机应用，2016，36（1）：33-38. （CHEN M， YU X H， LIU Y. Mining mobility patterns based on deep representation model [J]. Journal of Computer Applications， 2016， 36（1）： 33-38.）

[4]AILON N. Learning and optimizing with preferences [C]// ALT 2013： Proceedings of the 24th International Conference on Algorithmic Learning Theory， LNCS 8139. Berlin： Springer-Verlag， 2013： 13-21.

[5]SHI Y， LARSON M， HANJALIC A. Collaborative filtering beyond the user-item matrix： a survey of the state of the art and future challenges [J]. ACM Computer Surveys， 2014， 47（1）： Article No. 3.

[6]GURUSWAMI M， SUNITHA T. Efficient robust interactive personalized mobile search engine [J]. International Journal of Computer Trends and Technology， 2015， 19（1）： 30-33.

[7]WANG X， WANG Y. Improving content-based and hybrid music recommendation using deep learning [C]// MM 14： Proceedings of the 22nd ACM International Conference on Multimedia. New York： ACM， 2014： 627-636.

[8]PROCACCIA A D， SHAH N， ZICK Y. Voting rules as error-correcting codes [J]. Artificial Intelligence， 2016， 231： 1-16.

Proceedings of the Twenty-Ninth AAAI Conference on Artificial Intelligence

http：//www.cs.cmu.edu/～nkshah/papers/error.aaai.pdf

[9]DE AMO S， DIALLO M S， DIOP C T， et al. Contextual preference mining for user profile construction [J]. Information Systems， 2015， 49： 182-199.

[10]DIMOPOULOS Y， MICHAEL L， ATHIENITOU F. Ceteris paribus preference elicitation with predictive guarantees [C]// IJCAI 09： Proceedings of the 21st International Joint Conference on Artificial Intelligence. San Francisco， CA： Morgan Kaufmann， 2009： 1890-1895.

[11]DE AMO S， BUENO M L P， ALVES G， et al. CPrefMiner： an algorithm for mining user contextual preferences based on Bayesian networks [C]// Proceedings of the 2012 IEEE 24th International Conference on Tools with Artificial Intelligence. Piscataway， NJ： IEEE， 2012， 1： 114-121.

[12]BOUTILIER C， BRAFMAN R I， DOMSHLAK C， et al. CP-nets： a tool for representing and reasoning with conditional ceteris paribus preference statements [J]. Journal of Artificial Intelligence Research， 2004， 21（1）： 135-191.

[13]WILSON N. Extending CP-nets with stronger conditional preference statements [C]// AAAI-04： Proceedings of the Nineteenth National Conference on Artificial Intelligence. Menlo Park， CA： AAAI， 2004： 735-741.

[14]PEREIRA F S F， DE AMO S. Evaluation of conditional preference queries [J]. Journal of Information and Data Management， 2010， 1（3）： 503-518.

[15]LIU J， LIAO S. Expressive efficiency of two kinds of specific CP-nets [J]. Information Sciences， 2015， 295： 379-394.

[16]刘惊雷.CP-nets及其表达能力研究[J].自动化学报，2011，37（3）：290-302. （LIU J L. Research on CP-nets and its expressive power [J]. Acta Automatica Sinica， 2011， 37（3）： 290-302.）

[17]辛冠琳，刘惊雷.基于G方检验的CP-nets学习[J].南京大学学报（自然科学版），2015，51（4）：781-795. （XIN G L， LIU J L. Learning CP-nets based on G2 test [J]. Journal of Nanjing University （Natural Sciences）， 2015， 51（4）： 781-795.）

[18]COHEN W W， SCHAPIRE R E， SINGER Y. Learning to order things [J]. Journal of Artificial Intelligence Research， 1999， 10（5）： 243-270.

http：//xueshu.baidu.com/s？wd=paperuri%3A%280c6f3a33ffc97a5ee52530d6f06a93a3%29&filter=sc_long_sign&tn=SE_xueshusource_2kduw22v&sc_vurl=http%3A%2F%2Fadsabs.harvard.edu%2Fabs%2F2011arXiv1105.5464C&ie=utf-8&sc_us=16692312367941757205

NIPS '97 Proceedings of the 1997 conference on Advances in neural information processing systems 10

Pages 451-457

MIT Press Cambridge， MA， USA 1998

[19]JOACHIMS T. Optimizing search engines using clickthrough data [C]// KDD 02： Proceedings of the Eighth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York： ACM， 2002： 133-142.

[20]HOLLAND S， ESTER M， KIEΒLING W. Preference mining： a novel approach on mining user preferences for personalized applications [C]// PKDD 2003： Proceedings of the 7th European Conference on Principles and Practice of Knowledge Discovery in Databases， LNCS 2838. Berlin： Springer-Verlag， 2003： 204-216.

[21]JIANG B， PEI J， LIN X， et al. Mining preferences from superior and inferior examples [C]// KDD 08： Proceedings of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York： ACM， 2008： 390-398.

[22]KORICHE F， ZANUTTINI B. Learning conditional preference networks [J]. Artificial Intelligence， 2010， 174（11）： 685-703.

[23]DE AMO S， DIALLO M S， DIOP C T， et al. Mining contextual preference rules for building user profiles [C]// Proceedings of the 14th International Conference on Data Warehousing and Knowledge Discovery， LNCS 7448. Berlin： Springer-Verlag， 2012： 229-242.

[24]DE AMO S， BUENO M L P， ALVES G， et al. Mining user contextual preferences [J]. Journal of Information & Data Management， 2013， 4（1）： 37-46.

[25]DOYLE J， SHOHAM Y， WELLMAN M P. A logic of relative desire （preliminary report） [C]// ISMIS 91： Proceedings of the 6th International Symposium on Methodologies for Intelligent Systems. London， UK： Springer-Verlag， 1991： 16-31.

[26]MCGEACHIE M， DOYLE J. Utility functions for ceteris paribus preferences [J]. Computational Intelligence， 2004， 20（2）： 158-217.